Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python list 合并连接字符串的方法
Mar 09 Python
python django集成cas验证系统
Jul 14 Python
Python基于twisted实现简单的web服务器
Sep 29 Python
Python多线程下载文件的方法
Jul 10 Python
Python字符串匹配算法KMP实例
Jul 18 Python
Python 基于Twisted框架的文件夹网络传输源码
Aug 28 Python
Python数据处理numpy.median的实例讲解
Apr 02 Python
pygame实现俄罗斯方块游戏(AI篇2)
Oct 29 Python
pandas-resample按时间聚合实例
Dec 27 Python
Django配置Bootstrap, js实现过程详解
Oct 13 Python
python数据抓取3种方法总结
Feb 07 Python
Python 中random 库的详细使用
Jun 03 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
一道关于php变量引用的面试题
2010/08/08 PHP
获取php页面执行时间,数据库读写次数,函数调用次数等(THINKphp)
2013/06/03 PHP
PHP中Closure类的使用方法及详解
2015/10/09 PHP
thinkPHP5 tablib标签库自定义方法详解
2017/05/10 PHP
JavaScript 定义function的三种方式小结
2009/10/16 Javascript
使用Firebug对js进行断点调试的图文方法
2011/04/02 Javascript
jQuery EasyUI API 中文文档 - ComboGrid 组合表格
2011/10/13 Javascript
日历查询的算法 如何计算某一天是星期几
2012/12/12 Javascript
利用jq让你的div居中的好方法分享
2013/11/21 Javascript
jquery使用append(content)方法注意事项分享
2014/01/06 Javascript
同一个网页中实现多个JavaScript特效的方法
2015/02/02 Javascript
ECMAScript5(ES5)中bind方法使用小结
2015/05/07 Javascript
AngularJS 依赖注入详解及示例代码
2016/08/17 Javascript
AngularJS实现单独作用域内的数据操作
2016/09/05 Javascript
对javascript继承的理解
2016/10/11 Javascript
详解如何在Vue2中实现组件props双向绑定
2017/03/29 Javascript
深究AngularJS中ng-drag、ng-drop的用法
2017/06/12 Javascript
微信小程序获取微信运动步数的实例代码
2017/07/20 Javascript
CheckBox多选取值及判断CheckBox选中是否为空的实例
2017/10/31 Javascript
javascript事件监听与事件委托实例详解
2019/08/16 Javascript
pycharm 使用心得(二)设置字体大小
2014/06/05 Python
浅谈DataFrame和SparkSql取值误区
2018/06/09 Python
Python 继承,重写,super()调用父类方法操作示例
2019/09/29 Python
python队列原理及实现方法示例
2019/11/27 Python
Python3查找列表中重复元素的个数的3种方法详解
2020/02/13 Python
CSS3 background-image颜色渐变的实现代码
2018/09/13 HTML / CSS
美国台面电器和厨具品牌:KitchenAid
2019/04/12 全球购物
网络工程与软件技术毕业生自荐信
2013/09/24 职场文书
劳资协议书范本
2014/04/23 职场文书
美术学专业求职信
2014/07/23 职场文书
2014年幼儿园园长工作总结
2014/12/17 职场文书
优秀班主任推荐材料
2014/12/17 职场文书
求职信内容一般写什么?
2015/03/20 职场文书
预备党员转正党小组意见
2015/06/01 职场文书
2015年小学生暑假总结
2015/07/13 职场文书
自信主题班会
2015/08/14 职场文书