Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python使用matplotlib绘制动画的方法
May 20 Python
Python字符串处理实例详解
May 18 Python
PyTorch线性回归和逻辑回归实战示例
May 22 Python
详解Python学习之安装pandas
Apr 16 Python
在win10和linux上分别安装Python虚拟环境的方法步骤
May 09 Python
python3 property装饰器实现原理与用法示例
May 15 Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 Python
Django添加bootstrap框架时无法加载静态文件的解决方式
Mar 27 Python
如何利用python读取micaps文件详解
Oct 18 Python
Python爬虫之Selenium实现窗口截图
Dec 04 Python
Python进阶学习之带你探寻Python类的鼻祖-元类
May 08 Python
python 如何将两个实数矩阵合并为一个复数矩阵
May 19 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
php文字水印和php图片水印实现代码(二种加水印方法)
2013/12/25 PHP
php实现邮件发送并带有附件
2014/01/24 PHP
PHP写日志的实现方法
2014/11/05 PHP
php生成验证码函数
2015/10/20 PHP
php设计模式之单例模式用法经典示例分析
2019/09/20 PHP
Mac/Windows下如何安装Node.js
2013/11/22 Javascript
js实现点击链接后窗口缩小并居中的方法
2015/03/02 Javascript
高效利用Angular中内置服务$http、$location等
2016/03/22 Javascript
JavaScript基于原型链的继承
2016/06/22 Javascript
基于JavaScript实现多级菜单效果
2017/07/25 Javascript
使用travis-ci如何持续部署node.js应用详解
2017/07/30 Javascript
Three.js利用Detector.js插件如何实现兼容性检测详解
2017/09/26 Javascript
纯JS实现出生日期[年月日]下拉菜单效果
2018/06/01 Javascript
Vue-router的使用和出现空白页,路由对象属性详解
2018/09/03 Javascript
JavaScript 复制对象与Object.assign方法无法实现深复制
2018/11/02 Javascript
js实现倒计时秒杀效果
2020/03/25 Javascript
解决三元运算符 报错“SyntaxError: can''t assign to conditional expression”
2020/02/12 Javascript
vue页面跳转实现页面缓存操作
2020/07/22 Javascript
Python OpenCV读取png图像转成jpg图像存储的方法
2018/10/28 Python
python语言基本语句用法总结
2019/06/11 Python
100行Python代码实现每天不同时间段定时给女友发消息
2019/09/27 Python
python 生成器和迭代器的原理解析
2019/10/12 Python
在Python中等距取出一个数组其中n个数的实现方式
2019/11/27 Python
手动安装python3.6的操作过程详解
2020/01/13 Python
PyCharm 2020 激活到 2100 年的教程
2020/03/25 Python
如何在python中执行另一个py文件
2020/04/30 Python
python如何修改文件时间属性
2021/02/05 Python
NUK奶瓶美国官网:NUK美国
2016/09/26 全球购物
澳大利亚顶级美发和美容贸易超市:glamaCo
2020/01/19 全球购物
介绍一下grep命令的使用
2012/06/28 面试题
模具专业推荐信
2013/10/30 职场文书
退伍老兵事迹材料
2014/01/31 职场文书
小区保洁员岗位职责
2015/04/10 职场文书
学术会议通知范文
2015/04/15 职场文书
大学新生入学感想
2015/08/07 职场文书
2016春季校长开学典礼致辞
2015/11/26 职场文书