Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python中time模块和datetime模块的用法示例
Feb 28 Python
python利用rsa库做公钥解密的方法教程
Dec 10 Python
TensorFlow神经网络优化策略学习
Mar 09 Python
Python实现的爬虫刷回复功能示例
Jun 07 Python
对Python发送带header的http请求方法详解
Jan 02 Python
Python使用grequests(gevent+requests)并发发送请求过程解析
Sep 25 Python
NumPy中的维度Axis详解
Nov 26 Python
Pytorch 实现sobel算子的卷积操作详解
Jan 10 Python
python raise的基本使用
Sep 10 Python
Python 高级库15 个让新手爱不释手(推荐)
May 15 Python
Python 批量下载阴阳师网站壁纸
May 19 Python
Python中的np.argmin()和np.argmax()函数用法
Jun 02 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
php中设置多级目录session的问题
2011/08/08 PHP
关于shopex同步ucenter的redirect问题,导致script不运行
2013/04/10 PHP
ThinkPHP模版引擎之变量输出详解
2014/12/05 PHP
PHP实现加强版加密解密类实例
2015/07/29 PHP
PHP如何读取由JavaScript设置的Cookie
2017/03/22 PHP
javascript下arguments,caller,callee,call,apply示例及理解
2009/12/24 Javascript
用apply让javascript函数仅执行一次的代码
2010/06/27 Javascript
js对象关系图 方便dom操作
2012/03/18 Javascript
JS 两个字符串时间的天数差计算
2013/08/25 Javascript
js实现不提交表单获取单选按钮值的方法
2015/08/21 Javascript
基于jQuery倒计时插件实现团购秒杀效果
2016/05/13 Javascript
AngularJS 依赖注入详解和简单实例
2016/07/28 Javascript
canvas 弹幕效果(实例分享)
2017/01/11 Javascript
详解webpack分离css单独打包
2017/06/21 Javascript
JavaScript中document.referrer的用法详解
2017/07/04 Javascript
详解webpack之scss和postcss-loader的配置
2018/01/09 Javascript
微信小程序实现全国机场索引列表
2018/01/31 Javascript
解决vue中对象属性改变视图不更新的问题
2018/02/23 Javascript
JS严格模式知识点总结
2018/02/27 Javascript
解决vue处理axios post请求传参的问题
2018/03/05 Javascript
Javascript 关于基本类型和引用类型的个人理解
2019/11/01 Javascript
详解如何在Javascript中使用Object.freeze()
2020/10/18 Javascript
js实现随机点名功能
2020/12/23 Javascript
[03:16]DOTA2完美大师赛主赛事首日集锦
2017/11/23 DOTA
为python设置socket代理的方法
2015/01/14 Python
Python解析树及树的遍历
2016/02/03 Python
编写Python爬虫抓取暴走漫画上gif图片的实例分享
2016/04/20 Python
使用python打印十行杨辉三角过程详解
2019/07/10 Python
Python操作Elasticsearch处理timeout超时
2020/07/17 Python
html5写一个BUI折叠菜单插件的实现方法
2019/09/11 HTML / CSS
MADE法国:提供原创设计师家具
2018/09/18 全球购物
公司成本主管岗位责任制
2014/02/21 职场文书
群众路线对照检查材料思想汇报怎么写
2014/09/18 职场文书
介绍信格式
2015/01/30 职场文书
心灵点滴观后感
2015/06/02 职场文书
python如何读取.mtx文件
2021/04/22 Python