pyhanlp安装介绍和简单应用


Posted in Python onFebruary 22, 2019

1. 前言

中文分词≠自然语言处理!

Hanlp

HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 文本分类 拼音简繁

中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。

不同于一些简陋的分词类库,HanLP精心优化了内部数据结构和IO接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120MB。无论是移动设备还是大型集群,都能获得良好的体验。

不同于市面上的商业工具,HanLP提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。项目主页上提供了详细的文档,以及在一些开源语料上训练的模型。

HanLP希望兼顾学术界的精准与工业界的效率,在两者之间取一个平衡,真正将自然语言处理普及到生产环境中去。

我们使用的pyhanlp是用python包装了HanLp的java接口。

2. pyhanlp的安装和使用

2.1 python下安装pyhanlp

pip安装

sudo pip3 install pyhanlp

第一次import pyhanlp会下载一个比较大的数据集,需要耐心等待下,后面再import就不会有了。

from pyhanlp import *

详情请见pyhanlp官方文档

2.2 pyhanlp简单使用方法

分词使用

from pyhanlp import *
print(HanLP.segment("今天开心了吗?"))
>>> [今天/t, 开心/a, 了/ule, 吗/y, ?/w]

依存分析使用

from pyhanlp import *
print(HanLP.parseDependency("今天开心了吗?"))
>>> 1  今天 今天 nt t  _  2  状中结构  _  _
>>> 2  开心 开心 a  a  _  0  核心关系  _  _
>>> 3  了  了  e  y  _  2  右附加关系  _  _
>>> 4  吗  吗  e  y  _  2  右附加关系  _  _
>>> 5  ?  ?  wp w  _  2  标点符号  _  _

2.3 pyhanlp可视化

如果大家看不太清楚上面的输出,pyhanlp提供了一个很好的展示交付界面,只要一句命令就能启动一个web服务

hanlp serve

登录http://localhost:8765就能看下可视化界面,能看到分词结果和依存关系的结果,是不是很直观。这个网页上还有安装说明、源码链接、文档链接、常见的问题(FAQ)。

pyhanlp安装介绍和简单应用

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中处理时间之clock()方法的使用
May 22 Python
Python中有趣在__call__函数
Jun 21 Python
numpy实现合并多维矩阵、list的扩展方法
May 08 Python
Python面向对象程序设计类的封装与继承用法示例
Apr 12 Python
十分钟搞定pandas(入门教程)
Jun 21 Python
python画双y轴图像的示例代码
Jul 07 Python
Python 实现自动获取种子磁力链接方式
Jan 16 Python
opencv python图像梯度实例详解
Feb 04 Python
pytorch数据预处理错误的解决
Feb 20 Python
python 基于opencv 绘制图像轮廓
Dec 11 Python
利用Python函数实现一个万历表完整示例
Jan 23 Python
聊聊基于pytorch实现Resnet对本地数据集的训练问题
Mar 25 Python
Python3.7 dataclass使用指南小结
Feb 22 #Python
Python文件读写常见用法总结
Feb 22 #Python
Python 通过requests实现腾讯新闻抓取爬虫的方法
Feb 22 #Python
解决python3.5 正常安装 却不能直接使用Tkinter包的问题
Feb 22 #Python
浅谈python3.6的tkinter运行问题
Feb 22 #Python
Scrapy框架爬取西刺代理网免费高匿代理的实现代码
Feb 22 #Python
在Python运行时动态查看进程内部信息的方法
Feb 22 #Python
You might like
php中iconv函数使用方法
2008/05/24 PHP
利用ThinkPHP内置的ThinkAjax实现异步传输技术的实现方法
2011/12/19 PHP
一个显示某段时间内每个月的方法 返回由这些月份组成的数组
2012/05/16 PHP
探讨如何使用SimpleXML函数来加载和解析XML文档
2013/06/07 PHP
phpmailer发送gmail邮件实例详解
2013/06/24 PHP
编译PHP报错configure error Cannot find libmysqlclient under usr的解决方法
2014/06/27 PHP
php5.3不能连接mssql数据库的解决方法
2014/12/27 PHP
PHP解析RSS的方法
2015/03/05 PHP
PHP SplObjectStorage使用实例
2015/05/12 PHP
jQuery插件实现表格隔行换色且感应鼠标高亮行变色
2013/09/22 Javascript
js中创建对象的几种方式示例介绍
2014/01/26 Javascript
JavaScript实现通过select标签跳转网页的方法
2016/09/29 Javascript
jquery  实现轮播图详解及实例代码
2016/10/12 Javascript
浅谈Node.js:Buffer模块
2016/12/05 Javascript
JavaScript 保护变量不被随意修改的实现代码
2017/09/27 Javascript
详解react-redux插件入门
2018/04/19 Javascript
vue 优化CDN加速的方法示例
2018/09/19 Javascript
vue19 组建 Vue.extend component、组件模版、动态组件 的实例代码
2019/04/04 Javascript
微信小程序实现的一键复制功能示例
2019/04/24 Javascript
jquery UI实现autocomplete在获取焦点时得到显示列表功能示例
2019/06/04 jQuery
cordova+vue+webapp使用html5获取地理位置的方法
2019/07/06 Javascript
layui实现tab的添加拒绝重复的方法
2019/09/04 Javascript
微信小程序分享小程序码的生成(带参数)以及参数的获取
2020/03/25 Javascript
微信小程序实现天气预报功能(附源码)
2020/12/10 Javascript
python查找目录下指定扩展名的文件实例
2015/04/01 Python
Python3读取文件常用方法实例分析
2015/05/22 Python
python在每个字符后添加空格的实例
2018/05/07 Python
ipad上运行python的方法步骤
2019/10/12 Python
HTML5 localStorage使用总结
2017/02/22 HTML / CSS
草莓网化妆品日本站:Strawberrynet日本
2017/10/20 全球购物
《一本男孩子必读的书》教学反思
2014/02/19 职场文书
成龙洗发水广告词
2014/03/14 职场文书
社区创先争优承诺书
2014/08/30 职场文书
营销经理工作检讨书
2014/11/03 职场文书
2015年银行员工工作总结
2015/04/24 职场文书
金正昆讲礼仪观后感
2015/06/11 职场文书