Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python编写生成验证码的脚本的教程
May 04 Python
python实现自动更换ip的方法
May 05 Python
利用aardio给python编写图形界面
Aug 21 Python
Window10+Python3.5安装opencv的教程推荐
Apr 02 Python
Python调用C++,通过Pybind11制作Python接口
Oct 16 Python
浅谈python的输入输出,注释,基本数据类型
Apr 02 Python
python递归下载文件夹下所有文件
Aug 31 Python
Matplotlib绘制雷达图和三维图的示例代码
Jan 07 Python
基于python实现把json数据转换成Excel表格
May 07 Python
10行Python代码实现Web自动化管控的示例代码
Aug 14 Python
python爬虫调度器用法及实例代码
Nov 30 Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
php zip文件解压类代码
2009/12/02 PHP
PHP实现根据设备类型自动跳转相应页面的方法
2014/07/24 PHP
jQuery 隔行换色 支持键盘上下键,按Enter选定值
2009/08/02 Javascript
jquery插件之定时查询待处理任务数量
2014/05/01 Javascript
DVA框架统一处理所有页面的loading状态
2017/08/25 Javascript
基于模板引擎Jade的应用(详解)
2017/12/12 Javascript
基于$.ajax()方法从服务器获取json数据的几种方式总结
2018/01/31 Javascript
详解Bootstrap 学习(一)入门
2019/04/12 Javascript
Vue 中使用富文本编译器wangEditor3的方法
2019/09/26 Javascript
在Webpack中用url-loader处理图片和字体的问题
2020/04/28 Javascript
深入webpack打包原理及loader和plugin的实现
2020/05/06 Javascript
[03:14]DOTA2斧王 英雄基础教程
2013/11/26 DOTA
[40:55]DOTA2上海特级锦标赛主赛事日 - 2 败者组第二轮#4Newbee VS Fnatic
2016/03/03 DOTA
python中list常用操作实例详解
2015/06/03 Python
使用Python的urllib2模块处理url和图片的技巧两则
2016/02/18 Python
python多线程socket编程之多客户端接入
2017/09/12 Python
python3中函数参数的四种简单用法
2018/07/09 Python
Python 根据日志级别打印不同颜色的日志的方法示例
2019/08/08 Python
pytorch在fintune时将sequential中的层输出方法,以vgg为例
2019/08/20 Python
python zip()函数使用方法解析
2019/10/31 Python
python 项目目录结构设置
2020/02/14 Python
浅谈python的elementtree模块处理中文注意事项
2020/03/06 Python
python中for in的用法详解
2020/04/17 Python
基于python检查矩阵计算结果
2020/05/21 Python
Python参数传递对象的引用原理解析
2020/05/22 Python
Python 列表反转显示的四种方法
2020/11/16 Python
html5定位获取当前位置并在百度地图上显示
2014/08/22 HTML / CSS
澳大利亚家居用品零售商:Harris Scarfe
2020/10/10 全球购物
英文自我鉴定
2013/12/10 职场文书
项目考察欢迎辞
2014/01/17 职场文书
幼儿园综治宣传月活动总结
2015/05/07 职场文书
党员转正意见怎么写
2015/06/03 职场文书
入党申请书格式
2019/06/20 职场文书
详解CSS开发过程中的20个快速提升技巧
2021/05/21 HTML / CSS
Python 实现绘制子图及子图刻度的变换等问题
2021/05/31 Python
CSS实现渐变色边框(Gradient borders)的5种方法
2022/03/25 HTML / CSS