Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python中global用法实例分析
Apr 30 Python
Python使用defaultdict读取文件各列的方法
May 11 Python
python版微信跳一跳游戏辅助
Jan 11 Python
Python实现中一次读取多个值的方法
Apr 22 Python
python遍历文件夹找出文件夹后缀为py的文件方法
Oct 21 Python
使用python根据端口号关闭进程的方法
Nov 06 Python
django使用LDAP验证的方法示例
Dec 10 Python
python用fsolve、leastsq对非线性方程组求解
Dec 15 Python
利用python开发app实战的方法
Jul 09 Python
如何基于Python批量下载音乐
Nov 11 Python
Python爬虫简单运用爬取代理IP的实现
Dec 01 Python
python 实现百度网盘非会员上传超过500个文件的方法
Jan 07 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
如何对PHP程序中的常见漏洞进行攻击(上)
2006/10/09 PHP
基于mysql的bbs设计(一)
2006/10/09 PHP
PHP实现多条件查询实例代码
2010/07/17 PHP
codeigniter自带数据库类使用方法说明
2014/03/25 PHP
Laravel 5 学习笔记
2015/03/06 PHP
再推荐十款免费的php开发工具
2015/11/09 PHP
ThinkPHP框架实现的微信支付接口开发完整示例
2019/04/10 PHP
Prototype使用指南之selector.js说明
2008/10/26 Javascript
Javascript 作用域使用说明
2009/08/13 Javascript
通过jQuery打造支持汉字,拼音,英文快速定位查询的超级select插件
2010/06/18 Javascript
jquery 与NVelocity 产生冲突的解决方法
2011/06/13 Javascript
Jquery通过Ajax方式来提交Form表单的具体实现
2013/11/07 Javascript
js实现左侧网页tab滑动门效果代码
2015/09/06 Javascript
Node.js编写爬虫的基本思路及抓取百度图片的实例分享
2016/03/12 Javascript
js判断所有表单项不为空则提交表单的实现方法
2016/09/09 Javascript
微信小程序 wx.uploadFile在安卓手机上面the same task is working问题解决
2016/12/14 Javascript
Node.js学习教程之HTTP/2服务器推送【译】
2017/10/31 Javascript
JS组件系列之Gojs组件 前端图形化插件之利器
2017/11/29 Javascript
详解webpack require.ensure与require AMD的区别
2017/12/13 Javascript
vue实现word,pdf文件的导出功能
2018/07/31 Javascript
Layer.js实现表格溢出内容省略号显示,悬停显示全部的方法
2019/09/16 Javascript
vue+echarts+datav大屏数据展示及实现中国地图省市县下钻功能
2020/11/16 Javascript
[00:42]《辉夜杯》—职业组预选赛12月3日15点 正式打响
2015/12/03 DOTA
[00:17]DOTA2荣耀之路5:It’s a disastah!
2018/05/28 DOTA
解析Tensorflow之MNIST的使用
2020/06/30 Python
大专应届生个人简历的自我评价
2013/10/15 职场文书
优秀生推荐信范文
2013/11/28 职场文书
学习决心书范文
2014/03/11 职场文书
小学生手册家长评语
2014/04/16 职场文书
房地产置业顾问岗位职责
2015/04/11 职场文书
2015年平安创建工作总结
2015/04/29 职场文书
贷款担保书范本
2015/09/22 职场文书
2016年小学生寒假总结
2015/10/10 职场文书
MySQL sql_mode的使用详解
2021/05/08 MySQL
python百行代码实现汉服圈图片爬取
2021/11/23 Python
nginx容器方式反向代理实战
2022/04/18 Servers