pyhanlp安装介绍和简单应用


Posted in Python onFebruary 22, 2019

1. 前言

中文分词≠自然语言处理!

Hanlp

HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 文本分类 拼音简繁

中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。

不同于一些简陋的分词类库,HanLP精心优化了内部数据结构和IO接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120MB。无论是移动设备还是大型集群,都能获得良好的体验。

不同于市面上的商业工具,HanLP提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。项目主页上提供了详细的文档,以及在一些开源语料上训练的模型。

HanLP希望兼顾学术界的精准与工业界的效率,在两者之间取一个平衡,真正将自然语言处理普及到生产环境中去。

我们使用的pyhanlp是用python包装了HanLp的java接口。

2. pyhanlp的安装和使用

2.1 python下安装pyhanlp

pip安装

sudo pip3 install pyhanlp

第一次import pyhanlp会下载一个比较大的数据集,需要耐心等待下,后面再import就不会有了。

from pyhanlp import *

详情请见pyhanlp官方文档

2.2 pyhanlp简单使用方法

分词使用

from pyhanlp import *
print(HanLP.segment("今天开心了吗?"))
>>> [今天/t, 开心/a, 了/ule, 吗/y, ?/w]

依存分析使用

from pyhanlp import *
print(HanLP.parseDependency("今天开心了吗?"))
>>> 1  今天 今天 nt t  _  2  状中结构  _  _
>>> 2  开心 开心 a  a  _  0  核心关系  _  _
>>> 3  了  了  e  y  _  2  右附加关系  _  _
>>> 4  吗  吗  e  y  _  2  右附加关系  _  _
>>> 5  ?  ?  wp w  _  2  标点符号  _  _

2.3 pyhanlp可视化

如果大家看不太清楚上面的输出,pyhanlp提供了一个很好的展示交付界面,只要一句命令就能启动一个web服务

hanlp serve

登录http://localhost:8765就能看下可视化界面,能看到分词结果和依存关系的结果,是不是很直观。这个网页上还有安装说明、源码链接、文档链接、常见的问题(FAQ)。

pyhanlp安装介绍和简单应用

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现Const详解
Jan 27 Python
TensorFlow在MAC环境下的安装及环境搭建
Nov 14 Python
异步任务队列Celery在Django中的使用方法
Jun 07 Python
运用Python的webbrowser实现定时打开特定网页
Feb 21 Python
Python字符串的一些操作方法总结
Jun 10 Python
Python+opencv 实现图片文字的分割的方法示例
Jul 04 Python
Django Channels 实现点对点实时聊天和消息推送功能
Jul 17 Python
python实现根据给定坐标点生成多边形mask的例子
Feb 18 Python
Python requests获取网页常用方法解析
Feb 20 Python
python框架Django实战商城项目之工程搭建过程图文详解
Mar 09 Python
Python集成开发工具Pycharm的安装和使用详解
Mar 18 Python
python保存大型 .mat 数据文件报错超出 IO 限制的操作
May 10 Python
Python3.7 dataclass使用指南小结
Feb 22 #Python
Python文件读写常见用法总结
Feb 22 #Python
Python 通过requests实现腾讯新闻抓取爬虫的方法
Feb 22 #Python
解决python3.5 正常安装 却不能直接使用Tkinter包的问题
Feb 22 #Python
浅谈python3.6的tkinter运行问题
Feb 22 #Python
Scrapy框架爬取西刺代理网免费高匿代理的实现代码
Feb 22 #Python
在Python运行时动态查看进程内部信息的方法
Feb 22 #Python
You might like
php实现用户在线时间统计详解
2011/10/08 PHP
PHP分页详细讲解(有实例)
2013/10/30 PHP
Linux系统下使用XHProf和XHGui分析PHP运行性能
2015/12/08 PHP
Yii数据读取与跳转参数传递用法实例分析
2016/07/12 PHP
php魔法函数与魔法常量使用介绍
2017/07/23 PHP
关于php支持的协议与封装协议总结(推荐)
2017/11/17 PHP
不用AJAX和IFRAME,说说真正意义上的ASP+JS无刷新技术
2008/09/25 Javascript
一个简单的js动画效果代码
2010/07/20 Javascript
方便实用的jQuery checkbox复选框全选功能简单实例
2013/10/09 Javascript
JavaScript多图片上传案例
2015/09/28 Javascript
javascript巧用eval函数组装表单输入项为json对象的方法
2015/11/25 Javascript
RequireJS多页面应用实例分析
2016/06/29 Javascript
JS实现给json数组动态赋值的方法示例
2020/03/19 Javascript
js中变量的连续赋值(实例讲解)
2017/07/08 Javascript
浅谈vue+webpack项目调试方法步骤
2017/09/11 Javascript
原生JS检测CSS3动画是否结束的方法详解
2019/01/27 Javascript
vue-router跳转时打开新页面的两种方法
2019/07/29 Javascript
js实现图片上传即时显示效果
2019/09/30 Javascript
解决三元运算符 报错“SyntaxError: can''t assign to conditional expression”
2020/02/12 Javascript
[51:15]2014 DOTA2国际邀请赛中国区预选赛 Orenda VS LGD-GAMING
2014/05/22 DOTA
[50:21]Liquid vs Winstrike 2018国际邀请赛小组赛BO2 第二场
2018/08/19 DOTA
Python实现求笛卡尔乘积的方法
2017/09/16 Python
python迭代dict的key和value的方法
2018/07/06 Python
python设置环境变量的原因和方法
2019/06/24 Python
Python正则表达式匹配数字和小数的方法
2019/07/03 Python
日本无添加化妆品:HABA
2016/08/18 全球购物
HomeAway澳大利亚:预订你的度假屋,公寓、度假村、别墅等
2019/02/20 全球购物
英国伦敦的睡衣品牌:Asceno
2019/10/06 全球购物
工厂门卫岗位职责范本
2014/04/04 职场文书
《将心比心》教学反思
2014/04/08 职场文书
幼儿园庆元旦主持词
2015/07/06 职场文书
国庆节主题班会
2015/08/15 职场文书
如何用Node.js编写内存效率高的应用程序
2021/04/30 Javascript
学会用Python实现滑雪小游戏,再也不用去北海道啦
2021/05/20 Python
Mysql数据库值的添加、修改、删除及清空操作实例
2021/06/20 MySQL
每日六道java新手入门面试题,通往自由的道路
2021/06/30 Java/Android