Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python线程的两种编程方式
Apr 14 Python
Python实现简单文本字符串处理的方法
Jan 22 Python
python socket网络编程之粘包问题详解
Apr 28 Python
python 实现将字典dict、列表list中的中文正常显示方法
Jul 06 Python
python根据list重命名文件夹里的所有文件实例
Oct 25 Python
PyCharm-错误-找不到指定文件python.exe的解决方法
Jul 01 Python
Django ORM实现按天获取数据去重求和例子
May 18 Python
Pycharm中配置远程Docker运行环境的教程图解
Jun 11 Python
详解pyinstaller生成exe的闪退问题解决方案
Jun 19 Python
Django执行源生mysql语句实现过程解析
Nov 12 Python
pytorch 实现在测试的时候启用dropout
May 27 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
基于文本的搜索
2006/10/09 PHP
运用jquery实现table单双行不同显示并能单行选中
2009/07/25 Javascript
一个html5播放视频的video控件只支持android的默认格式mp4和3gp
2014/05/08 Javascript
jQuery获取上传文件的名称的正则表达式
2015/05/21 Javascript
AngularJS 路由详解和简单实例
2016/07/28 Javascript
Sortable.js拖拽排序使用方法解析
2016/11/04 Javascript
js实现导航栏中英文切换效果
2017/01/16 Javascript
JavaScript实现左右下拉框动态增删示例
2017/03/09 Javascript
parabola.js抛物线与加入购物车效果的示例代码
2017/10/25 Javascript
实例讲解javascript实现异步图片上传方法
2017/12/05 Javascript
微信小程序实现动态设置placeholder提示文字及按钮选中/取消状态的方法
2017/12/14 Javascript
JavaScript实现随机五位数验证码
2019/09/27 Javascript
vue中监听路由参数的变化及方法
2019/12/06 Javascript
使用JS实现动态时钟
2020/03/12 Javascript
微信小程序对图片进行canvas压缩的方法示例详解
2020/11/12 Javascript
Python统计列表中的重复项出现的次数的方法
2014/08/18 Python
Python基于smtplib实现异步发送邮件服务
2015/05/28 Python
分析python动态规划的递归、非递归实现
2018/03/04 Python
python合并同类型excel表格的方法
2018/04/01 Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
2019/01/08 Python
Django框架中间件(Middleware)用法实例分析
2019/05/24 Python
如何安装并在pycharm使用selenium的方法
2020/04/30 Python
python os模块在系统管理中的应用
2020/06/22 Python
儿科护理实习自我鉴定
2013/09/19 职场文书
学校运动会开幕演讲稿
2014/01/04 职场文书
物业总经理岗位职责
2014/02/28 职场文书
教师业务培训方案
2014/05/01 职场文书
个人批评与自我批评材料
2014/10/17 职场文书
入党积极分子半年考察意见
2015/06/02 职场文书
聘任合同书
2015/09/21 职场文书
2016年幼儿园万圣节活动总结
2016/04/05 职场文书
《初涉尘世》读后感3篇
2020/01/10 职场文书
python 实现的截屏工具
2021/05/08 Python
Redis Cluster集群动态扩容的实现
2021/07/15 Redis
MySQL分区以及建索引的方法总结
2022/04/13 MySQL
分析SQL窗口函数之排名窗口函数
2022/04/21 Oracle