Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
跟老齐学Python之通过Python连接数据库
Oct 28 Python
python编写暴力破解zip文档程序的实例讲解
Apr 24 Python
对Python 窗体(tkinter)树状数据(Treeview)详解
Oct 11 Python
Python3.5面向对象程序设计之类的继承和多态详解
Apr 24 Python
Python 词典(Dict) 加载与保存示例
Dec 06 Python
Python3 A*寻路算法实现方式
Dec 24 Python
Pytorch 实现focal_loss 多类别和二分类示例
Jan 14 Python
python函数调用,循环,列表复制实例
May 03 Python
Python结合Window计划任务监测邮件的示例代码
Aug 05 Python
Django返回HTML文件的实现方法
Sep 17 Python
Flask处理Web表单的实现方法
Jan 31 Python
基于PyQt5制作一个群发邮件工具
Apr 08 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
apache配置虚拟主机的方法详解
2013/06/17 PHP
php获取当前时间的毫秒数的方法
2014/01/26 PHP
php内核解析:PHP中的哈希表
2014/01/30 PHP
实现获取http内容的php函数分享
2014/02/16 PHP
PHP5各个版本的新功能和新特性总结
2014/03/16 PHP
PHP中余数、取余的妙用
2015/06/29 PHP
Zend Framework基于Command命令行建立ZF项目的方法
2017/02/18 PHP
[原创]php token使用与验证示例【测试可用】
2017/08/30 PHP
PHP扩展类型及安装方式解析
2020/04/27 PHP
ExtJS4 Grid改变单元格背景颜色及Column render学习
2013/02/06 Javascript
javascript 获取模态窗口的滚动位置代码
2013/08/06 Javascript
JS跨域问题详解
2014/11/25 Javascript
分享2个jQuery插件--jquery.fileupload与artdialog
2014/12/26 Javascript
JavaScript中的继承方式详解
2015/02/11 Javascript
Node.js中防止错误导致的进程阻塞的方法
2016/08/11 Javascript
vue项目中使用vue-i18n报错的解决方法
2019/01/13 Javascript
VUE 动态组件的应用案例分析
2019/12/02 Javascript
Vue切换div显示隐藏,多选,单选代码解析
2020/07/14 Javascript
python动态加载变量示例分享
2014/02/17 Python
使用Python来编写HTTP服务器的超级指南
2016/02/18 Python
利用python批量修改word文件名的方法示例
2017/10/17 Python
在python中使用正则表达式查找可嵌套字符串组
2017/10/24 Python
浅谈Python中的bs4基础
2018/10/21 Python
Python2和Python3.6环境解决共存问题
2018/11/09 Python
使用Matplotlib 绘制精美的数学图形例子
2019/12/13 Python
python剪切视频与合并视频的实现
2020/03/03 Python
python 用struct模块解决黏包问题
2020/11/07 Python
Django多数据库联用实现方法解析
2020/11/12 Python
用OpenCV进行年龄和性别检测的实现示例
2021/01/29 Python
HTML5之SVG 2D入门7—SVG元素的重用与引用
2013/01/30 HTML / CSS
巴西宠物商店:Cobasi
2019/04/19 全球购物
求职简历中的自我评价分享
2013/12/08 职场文书
有限责任公司股东合作协议书范本
2014/10/30 职场文书
初中语文教学反思范文
2016/03/03 职场文书
JavaScript 数组去重详解
2021/09/15 Javascript
windows10声卡驱动怎么安装?win10声卡驱动安装操作步骤教程
2022/08/05 数码科技