Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python简单的制作图片验证码实例
May 31 Python
利用Python破解斗地主残局详解
Jun 30 Python
python中利用Future对象异步返回结果示例代码
Sep 07 Python
python数据结构之列表和元组的详解
Sep 23 Python
python连接数据库的方法
Oct 19 Python
Python3处理HTTP请求的实例
May 10 Python
Python绘制并保存指定大小图像的方法
Jan 10 Python
tensorflow2.0保存和恢复模型3种方法
Feb 03 Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
Feb 11 Python
Python faker生成器生成虚拟数据代码实例
Jul 20 Python
python 中的命名空间,你真的了解吗?
Aug 19 Python
Python函数对象与闭包函数
Apr 13 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
动态新闻发布的实现及其技巧
2006/10/09 PHP
php a simple smtp class
2007/11/26 PHP
php文章内容分页并生成相应的htm静态页面代码
2010/06/07 PHP
PHP定时自动生成静态HTML的实现代码
2010/06/20 PHP
PHP中把stdClass Object转array的几个方法
2014/05/08 PHP
JScript中使用ADODB.Stream判断文件编码的代码
2008/06/09 Javascript
jQuery 数据缓存data(name, value)详解及实现
2010/01/04 Javascript
javascript自然分类法算法实现代码
2013/10/11 Javascript
JS实现拖动示例代码
2013/11/01 Javascript
使用Js让Html中特殊字符不被转义
2013/11/05 Javascript
js读写cookie实现一个底部广告浮层效果的两种方法
2013/12/29 Javascript
js图片闪动特效可以控制间隔时间如几分钟闪动一下
2014/08/12 Javascript
JQuery $.each遍历JavaScript数组对象实例
2014/09/01 Javascript
Nodejs全栈框架StrongLoop推荐
2014/11/09 NodeJs
JavaScript中的值类型转换介绍
2014/12/31 Javascript
jQuery实现简单的间隔向上滚动效果
2015/03/09 Javascript
jQuery实现div随意拖动的实例代码(通用代码)
2016/01/28 Javascript
三种AngularJS中获取数据源的方式
2016/02/02 Javascript
js仿QQ中对联系人向左滑动、滑出删除按钮的操作
2016/04/07 Javascript
JS组件Bootstrap实现图片轮播效果
2016/05/16 Javascript
Bootstrap基本插件学习笔记之轮播幻灯片(23)
2016/12/08 Javascript
纯js实现动态时间显示
2020/09/07 Javascript
解决layui checkbox 提交多个值的问题
2019/09/02 Javascript
详解利用eventemitter2实现Vue组件通信
2019/11/04 Javascript
vue实现图片裁剪后上传
2020/12/16 Vue.js
python通过pil模块获得图片exif信息的方法
2015/03/16 Python
python Django编写接口并用Jmeter测试的方法
2019/07/31 Python
python打包成so文件过程解析
2019/09/28 Python
Python通过Manager方式实现多个无关联进程共享数据的实现
2019/11/07 Python
python要安装在哪个盘
2020/06/15 Python
什么是python的必选参数
2020/06/21 Python
Python就将所有的英文单词首字母变成大写
2021/02/12 Python
KOHLER科勒美国官网:国际著名卫浴橱柜领先品牌
2020/06/27 全球购物
光荣入党自我鉴定
2014/01/22 职场文书
飞机制造技术专业求职信
2014/07/27 职场文书
选购到合适的激光打印机
2022/04/21 数码科技