Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中pygame安装方法图文详解
Nov 11 Python
Python sqlite3事务处理方法实例分析
Jun 19 Python
python3使用flask编写注册post接口的方法
Dec 28 Python
Python3.4学习笔记之列表、数组操作示例
Mar 01 Python
Python XlsxWriter模块Chart类用法实例分析
Mar 11 Python
PyCharm安装Markdown插件的两种方法
Jun 24 Python
Python实现朴素贝叶斯的学习与分类过程解析
Aug 24 Python
python 读取二进制 显示图片案例
Apr 24 Python
python实现xlwt xlrd 指定条件给excel行添加颜色
Jul 14 Python
给Django Admin添加验证码和多次登录尝试限制的实现
Jul 26 Python
Python大批量搜索引擎图像爬虫工具详解
Nov 16 Python
python百行代码实现汉服圈图片爬取
Nov 23 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
php中的实现trim函数代码
2007/03/19 PHP
DEDE采集大师官方留后门的删除办法
2011/01/08 PHP
PHP中redis的用法深入解析
2014/02/20 PHP
PHP四大安全策略
2014/03/12 PHP
smarty缓存用法分析
2014/12/16 PHP
PHP转换文本框内容为HTML格式的方法
2016/07/20 PHP
JS 添加网页桌面快捷方式的代码详细整理
2012/12/27 Javascript
jQuery侧边栏实现代码
2016/05/06 Javascript
微信小程序使用第三方库Underscore.js步骤详解
2016/09/27 Javascript
简单理解vue中Props属性
2016/10/27 Javascript
Avalonjs 实现简单购物车功能(实例代码)
2017/02/07 Javascript
javascript简单写的判断电话号码实例
2017/05/24 Javascript
ES6模块化的import和export用法方法总结
2017/08/08 Javascript
解决vue keep-alive 数据更新的问题
2018/09/21 Javascript
js中数组常用方法总结(推荐)
2019/04/09 Javascript
解决elementUI 切换tab后 el_table 固定列下方多了一条线问题
2020/07/19 Javascript
详解Django框架中用context来解析模板的方法
2015/07/20 Python
Python实现全角半角字符互转的方法
2016/11/28 Python
Python聊天室程序(基础版)
2018/04/01 Python
Opencv+Python 色彩通道拆分及合并的示例
2018/12/08 Python
python 利用jieba.analyse进行 关键词提取
2020/12/17 Python
python中PyQuery库用法分享
2021/01/15 Python
Answear匈牙利:来自全球200多个知名时尚品牌
2017/04/21 全球购物
英国和爱尔兰最大的地毯零售商:Kukoon
2018/12/17 全球购物
百度JavaScript笔试题
2015/01/15 面试题
数控技术专业推荐信
2013/11/01 职场文书
应届大学生自荐信
2013/12/05 职场文书
《池塘边的叫声》教学反思
2014/04/12 职场文书
服务承诺书格式
2014/05/21 职场文书
2014中考励志标语
2014/06/05 职场文书
争先创优公开承诺书
2014/08/30 职场文书
高一学年自我鉴定范文(3篇)
2014/09/26 职场文书
乡镇党的群众路线教育实践活动剖析材料
2014/10/09 职场文书
2015年综治维稳工作总结
2015/04/07 职场文书
JavaScript实例 ODO List分析
2022/01/22 Javascript
阿里云服务器部署RabbitMQ集群的详细教程
2022/06/01 Servers