Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python标准库os.path包、glob包使用实例
Nov 25 Python
介绍Python中的fabs()方法的使用
May 14 Python
python 系统调用的实例详解
Jul 11 Python
Python+tkinter使用40行代码实现计算器功能
Jan 30 Python
python实现控制台打印的方法
Jan 12 Python
PyTorch之图像和Tensor填充的实例
Aug 18 Python
django删除表重建的实现方法
Aug 28 Python
python Dijkstra算法实现最短路径问题的方法
Sep 19 Python
基于python实现学生信息管理系统
Nov 22 Python
python+opencv实现车牌定位功能(实例代码)
Dec 24 Python
python绘制汉诺塔
Mar 01 Python
【超详细】八大排序算法的各项比较以及各自特点
Mar 31 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
PHP中$_SERVER使用说明
2015/07/05 PHP
使用PHP如何实现高效安全的ftp服务器(一)
2015/12/20 PHP
PHP实现通过URL提取根域名
2016/03/31 PHP
jquery 问答知识整理
2010/02/11 Javascript
DB.ASP 用Javascript写ASP很灵活很好用很easy
2011/07/31 Javascript
jquery中ajax学习笔记3
2011/10/16 Javascript
拉动滚动条加载数据的jquery代码
2012/05/03 Javascript
基于jQuery捕获超链接事件进行局部刷新代码
2012/05/10 Javascript
Jquery下EasyUI组件中的DataGrid结果集清空方法
2014/01/06 Javascript
jQuery基础语法实例入门
2014/12/23 Javascript
jQuery通过控制节点实现仅在前台通过get方法完成参数传递
2015/02/02 Javascript
基于jQuery实现左侧菜单栏可折叠功能
2016/12/27 Javascript
Vue中v-show添加表达式的问题(判断是否显示)
2018/03/26 Javascript
Vue+element-ui 实现表格的分页功能示例
2018/08/18 Javascript
详解Ubuntu安装angular-cli遇到的坑
2018/09/08 Javascript
js+HTML5 canvas 实现简单的加载条(进度条)功能示例
2019/07/16 Javascript
Vue页面切换和a链接的本质区别详解
2019/11/12 Javascript
开发Node CLI构建微信小程序脚手架的示例
2020/03/27 Javascript
JavaScript浅层克隆与深度克隆示例详解
2020/09/01 Javascript
[45:52]完美世界DOTA2联赛PWL S3 Forest vs INK ICE 第二场 12.09
2020/12/12 DOTA
深入理解python中的浅拷贝和深拷贝
2016/05/30 Python
实时获取Python的print输出流方法
2019/01/07 Python
Python中IP地址处理IPy模块的方法
2019/08/16 Python
TensorFlow2.X使用图片制作简单的数据集训练模型
2020/04/08 Python
css3实现针线缝合效果(图解步骤)
2013/02/04 HTML / CSS
为什么要优先使用同步代码块而不是同步方法?
2013/01/30 面试题
GMP办公室主任岗位职责
2014/03/14 职场文书
精彩的演讲稿开头
2014/05/08 职场文书
小学社团活动总结
2014/06/27 职场文书
道路交通事故人身损害赔偿协议书
2014/11/19 职场文书
个人典型事迹材料
2014/12/30 职场文书
公文写作:新员工转正申请书范本3篇!
2019/08/07 职场文书
Python 居然可以在 Excel 中画画你知道吗
2022/02/15 Python
基于Python实现对比Exce的工具
2022/04/07 Python
Java 垃圾回收超详细讲解记忆集和卡表
2022/04/08 Java/Android
Mysql中mvcc各场景理解应用
2022/08/05 MySQL