pyhanlp安装介绍和简单应用


Posted in Python onFebruary 22, 2019

1. 前言

中文分词≠自然语言处理!

Hanlp

HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 文本分类 拼音简繁

中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。

不同于一些简陋的分词类库,HanLP精心优化了内部数据结构和IO接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120MB。无论是移动设备还是大型集群,都能获得良好的体验。

不同于市面上的商业工具,HanLP提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。项目主页上提供了详细的文档,以及在一些开源语料上训练的模型。

HanLP希望兼顾学术界的精准与工业界的效率,在两者之间取一个平衡,真正将自然语言处理普及到生产环境中去。

我们使用的pyhanlp是用python包装了HanLp的java接口。

2. pyhanlp的安装和使用

2.1 python下安装pyhanlp

pip安装

sudo pip3 install pyhanlp

第一次import pyhanlp会下载一个比较大的数据集,需要耐心等待下,后面再import就不会有了。

from pyhanlp import *

详情请见pyhanlp官方文档

2.2 pyhanlp简单使用方法

分词使用

from pyhanlp import *
print(HanLP.segment("今天开心了吗?"))
>>> [今天/t, 开心/a, 了/ule, 吗/y, ?/w]

依存分析使用

from pyhanlp import *
print(HanLP.parseDependency("今天开心了吗?"))
>>> 1  今天 今天 nt t  _  2  状中结构  _  _
>>> 2  开心 开心 a  a  _  0  核心关系  _  _
>>> 3  了  了  e  y  _  2  右附加关系  _  _
>>> 4  吗  吗  e  y  _  2  右附加关系  _  _
>>> 5  ?  ?  wp w  _  2  标点符号  _  _

2.3 pyhanlp可视化

如果大家看不太清楚上面的输出,pyhanlp提供了一个很好的展示交付界面,只要一句命令就能启动一个web服务

hanlp serve

登录http://localhost:8765就能看下可视化界面,能看到分词结果和依存关系的结果,是不是很直观。这个网页上还有安装说明、源码链接、文档链接、常见的问题(FAQ)。

pyhanlp安装介绍和简单应用

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python操作数据库之sqlite3打开数据库、删除、修改示例
Mar 13 Python
Python计算程序运行时间的方法
Dec 13 Python
从Python的源码来解析Python下的freeblock
May 11 Python
Python函数式编程
Jul 20 Python
python中计算一个列表中连续相同的元素个数方法
Jun 29 Python
实践Vim配置python开发环境
Jul 02 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 Python
python适合人工智能的理由和优势
Jun 28 Python
Python中IP地址处理IPy模块的方法
Aug 16 Python
python文件绝对路径写法介绍(windows)
Dec 25 Python
Python简单实现词云图代码及步骤解析
Jun 04 Python
python分分钟绘制精美地图海报
Feb 15 Python
Python3.7 dataclass使用指南小结
Feb 22 #Python
Python文件读写常见用法总结
Feb 22 #Python
Python 通过requests实现腾讯新闻抓取爬虫的方法
Feb 22 #Python
解决python3.5 正常安装 却不能直接使用Tkinter包的问题
Feb 22 #Python
浅谈python3.6的tkinter运行问题
Feb 22 #Python
Scrapy框架爬取西刺代理网免费高匿代理的实现代码
Feb 22 #Python
在Python运行时动态查看进程内部信息的方法
Feb 22 #Python
You might like
PHP中函数内引用全局变量的方法
2008/10/20 PHP
php中将汉字转换成拼音的函数代码
2012/09/08 PHP
ThinkPHP使用smarty模板引擎的方法
2014/07/01 PHP
php数组索引的Key加引号和不加引号的区别
2014/08/19 PHP
PHP图形计数器程序显示网站用户浏览量
2016/07/20 PHP
Yii2中使用asset压缩js,css文件的方法
2016/11/24 PHP
利用php操作memcache缓存的基础方法示例
2017/08/02 PHP
PHP实现模拟http请求的方法分析
2017/12/20 PHP
php桥接模式应用案例分析
2019/10/23 PHP
输入自动提示搜索提示功能的使用说明:sugggestion.txt
2013/09/02 Javascript
JS实现的数组全排列输出算法
2015/03/19 Javascript
jQuery延迟加载图片插件Lazy Load使用指南
2015/03/25 Javascript
基于JavaScript实现回到页面顶部动画代码
2016/05/24 Javascript
ionic 3.0+ 项目搭建运行环境的教程
2017/08/09 Javascript
详解vue-cli 接口代理配置
2017/12/13 Javascript
JS实现简单获取最近7天和最近3天日期的方法
2018/04/18 Javascript
video.js 一个页面同时播放多个视频的实例代码
2018/11/27 Javascript
详解VSCode配置启动Vue项目
2019/05/14 Javascript
node express使用HTML模板的方法示例
2019/08/22 Javascript
es6函数之箭头函数用法实例详解
2020/04/25 Javascript
python 字符串split的用法分享
2013/03/23 Python
在Docker上开始部署Python应用的教程
2015/04/17 Python
python实现马耳可夫链算法实例分析
2015/05/20 Python
pygame游戏之旅 调用按钮实现游戏开始功能
2018/11/21 Python
使用python实现mqtt的发布和订阅
2019/05/05 Python
python集合是否可变总结
2019/06/20 Python
Python 忽略文件名编码的方法
2020/08/01 Python
CSS3美化表单控件全集
2016/06/29 HTML / CSS
CSS3 Calc实现滚动条出现页面不跳动问题
2017/09/14 HTML / CSS
KEETSA环保床垫:更好的睡眠,更好的生活!
2016/11/24 全球购物
美国正宗奢华复古手袋、珠宝及配饰网站:What Goes Around Comes Around
2018/07/21 全球购物
施工协议书范本
2014/04/22 职场文书
新课培训心得体会
2014/09/03 职场文书
工作态度检讨书范文
2015/05/06 职场文书
2015年秋季学校开学标语
2015/07/16 职场文书
MySQL数据库表约束讲解
2022/06/21 MySQL