编程 Python

Python语言检测模块langid和langdetect的使用实例

Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点，今天提到的两个模块是检测数据的语言类型，比如是：中文还是英文，模块的使用方法也比较简单，我这里只是简单地使用了一下，因为项目中有这个需求，所以拿来用了一下，并没有深入地去研究这两个模块，模块的地址链接我都给出来了，需要的话可以去研究下：

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具，用于区分文本到底是什么语言，"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下：

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python语言检测模块langid和langdetect的使用实例

- Author -

Together_CZ

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python回调函数的使用方法

Jan 23 Python

在Windows8上的搭建Python和Django环境

Jul 03 Python

对Python的Django框架中的项目进行单元测试的方法

Apr 11 Python

给你选择Python语言实现机器学习算法的三大理由

Nov 15 Python

对python字典元素的添加与修改方法详解

Jul 06 Python

python leetcode 字符串相乘实例详解

Sep 03 Python

python清除字符串前后空格函数的方法

Oct 21 Python

谈谈Python中的while循环语句

Mar 10 Python

django删除表重建的实现方法

Aug 28 Python

使用pyplot.matshow()函数添加绘图标题

Jun 16 Python

Python实现Appium端口检测与释放的实现

Dec 31 Python

python工具——Mimesis的简单使用教程

Jan 16 Python

对python周期性定时器的示例详解

Feb 19 #Python

Python3数字求和的实例

Feb 19 #Python

对Python定时任务的启动和停止方法详解

Feb 19 #Python

python的schedule定时任务模块二次封装方法

Feb 19 #Python

Python3 max()函数基础用法

Feb 19 #Python

Python3 log10()函数简单用法

Feb 19 #Python

Python3中exp()函数用法分析

Feb 19 #Python

You might like

安健A254立体声随身听的分析与打磨

2021/03/02 无线电

咖啡与牛奶

2021/03/03 冲泡冲煮

咖啡是不是喝了会上瘾？咖啡是必须品吗！

2021/03/04 新手入门

解析php中heredoc的使用方法

2013/06/17 PHP

phpStudy配置多站点多域名方法及遇到的403错误解决方法

2017/10/19 PHP

JavaScript 面向对象编程（2）定义类

2010/05/18 Javascript

Jquery优化效率提升性能解决方案

2010/09/06 Javascript

jQuery实现带有洗牌效果的动画分页实例

2015/08/31 Javascript

JavaScript tab选项卡插件实例代码

2016/02/23 Javascript

基于javascript html5实现3D翻书特效

2016/03/14 Javascript

AngularJS $modal弹出框实例代码

2016/08/24 Javascript

基于JS实现checkbox全选功能实例代码

2016/10/31 Javascript

react-native ListView下拉刷新上拉加载实现代码

2017/08/03 Javascript

vue实现单选和多选功能

2017/08/11 Javascript

javascript实现Java中的Map对象功能的实例详解

2017/08/21 Javascript

JavaScript实现修改伪类样式

2017/11/27 Javascript

如何让你的JS代码更好看易读

2017/12/01 Javascript

微信小程序国际化探索实现(附源码地址)

2020/05/20 Javascript

深入理解NumPy简明教程---数组2

2016/12/17 Python

Python实现的爬取百度文库功能示例

2019/02/16 Python

pandas dataframe的合并实现（append, merge, concat）

2019/06/24 Python

python保存字典和读取字典的实例代码

2019/07/07 Python

简单总结CSS3中视窗单位Viewport的常见用法

2016/02/04 HTML / CSS

几个解决兼容IE6\7\8不支持html5标签的几个方法

2013/01/07 HTML / CSS

HTML5 video循环播放多个视频的方法步骤

2020/08/06 HTML / CSS

凯蒂·佩里个人女鞋品牌：Katy Perry Collections

2019/04/04 全球购物

Java基础知识面试要点

2016/07/29 面试题

写一个用矩形法求定积分的通用函数

2012/11/08 面试题

大学生活动总结怎么写

2014/04/29 职场文书

超越自我演讲稿

2014/05/21 职场文书

企业承诺书怎么写

2014/05/24 职场文书

公司食堂管理制度

2015/08/05 职场文书

《索溪峪的野》教学反思

2016/02/19 职场文书

高中议论文（范文2篇）

2019/08/19 职场文书

创业计划书之酒厂

2019/10/14 职场文书

使用PDF.js渲染canvas实现预览pdf的效果示例

2021/04/17 Javascript