Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python中使用mysql数据库详细介绍
Mar 27 Python
python访问类中docstring注释的实现方法
May 04 Python
python实现数独算法实例
Jun 09 Python
Python装饰器使用实例:验证参数合法性
Jun 24 Python
Python编程产生非均匀随机数的几种方法代码分享
Dec 13 Python
Python+selenium实现截图图片并保存截取的图片
Jan 05 Python
Python中实现变量赋值传递时的引用和拷贝方法
Apr 29 Python
解决Python 中英文混输格式对齐的问题
Jul 16 Python
win10 64bit下python NLTK安装教程
Sep 19 Python
详解如何在Apache中运行Python WSGI应用
Jan 02 Python
python里的单引号和双引号的有什么作用
Jun 17 Python
解决Python字典查找报Keyerror的问题
May 26 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
分享PHP入门的学习方法
2007/01/02 PHP
php生成验证码函数
2015/10/20 PHP
php获取是星期几的的一些常用姿势
2019/12/15 PHP
Jquery仿IGoogle实现可拖动窗口示例代码
2014/08/22 Javascript
浅析Node.js的Stream模块中的Readable对象
2015/07/29 Javascript
js实现跨域的几种方法汇总(图片ping、JSONP和CORS)
2015/10/25 Javascript
JavaScript学习笔记之取数组中最大值和最小值
2016/03/23 Javascript
jquery判断checkbox是否选中及改变checkbox状态的实现方法
2016/05/26 Javascript
js学习总结之DOM2兼容处理this问题的解决方法
2017/07/27 Javascript
JavaScript实现浅拷贝与深拷贝的方法分析
2018/07/05 Javascript
Angular8 Http拦截器简单使用教程
2019/08/20 Javascript
解决jquery validate 验证不通过后验证正确的信息仍残留在label上的方法
2019/08/27 jQuery
JS使用for in有序获取对象数据
2020/05/19 Javascript
node.js基础知识汇总
2020/08/25 Javascript
[04:40]2016国际邀请赛中国区预选赛全程TOP10镜头集锦
2016/07/01 DOTA
[42:25]2018DOTA2亚洲邀请赛 4.5 淘汰赛 LGD vs Liquid 第三场
2018/04/06 DOTA
MAC中PyCharm设置python3解释器
2017/12/15 Python
pycharm+django创建一个搜索网页实例代码
2018/01/24 Python
python3实现公众号每日定时发送日报和图片
2018/02/24 Python
Python函数装饰器常见使用方法实例详解
2019/03/30 Python
pyenv与virtualenv安装实现python多版本多项目管理
2019/08/17 Python
python字符串,元组,列表,字典互转代码实例详解
2020/02/14 Python
PyCharm2019.3永久激活破解详细图文教程,亲测可用(不定期更新)
2020/10/29 Python
英国在线汽车和面包车零件商店:Car Parts 4 Less
2018/08/15 全球购物
实习生自荐信范文
2013/11/13 职场文书
小学运动会广播稿200字(十二篇)
2014/01/14 职场文书
高中军训感言200字
2014/02/23 职场文书
党课培训主持词
2014/04/01 职场文书
文艺晚会策划方案
2014/06/11 职场文书
国际残疾人日广播稿范文
2014/10/09 职场文书
学校领导班子成员查摆问题及整改措施
2014/10/28 职场文书
成本会计实训报告
2014/11/05 职场文书
党员倡议书
2015/01/19 职场文书
《秋天的怀念》教学反思
2016/02/17 职场文书
python 实现德洛内三角剖分的操作
2021/04/22 Python
mysql优化之query_cache_limit参数说明
2021/07/01 MySQL