Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
深入理解Python中的内置常量
May 20 Python
Python 网页解析HTMLParse的实例详解
Aug 10 Python
python实现数据库跨服务器迁移
Apr 12 Python
Python使用pyshp库读取shapefile信息的方法
Dec 29 Python
Python3 中作为一等对象的函数解析
Dec 11 Python
基于Python3.6中的OpenCV实现图片色彩空间的转换
Feb 03 Python
Python 安装 virturalenv 虚拟环境的教程详解
Feb 21 Python
keras自定义回调函数查看训练的loss和accuracy方式
May 23 Python
python 解决mysql where in 对列表(list,,array)问题
Jun 06 Python
Python如何优雅删除字符列表空字符及None元素
Jun 25 Python
详解Python GUI编程之PyQt5入门到实战
Dec 10 Python
Python中time与datetime模块使用方法详解
Mar 31 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
限制ckeditor上传图片文件大小的方法
2013/11/15 PHP
CodeIgniter控制器之业务逻辑实例分析
2016/01/20 PHP
javascript学习笔记(十四) window对象使用介绍
2012/06/20 Javascript
JQuery制作的放大效果的popup对话框(未添加任何jquery plugin)分享
2013/04/28 Javascript
js调用css属性写法
2013/09/21 Javascript
页面js遇到乱码问题的解决方法是和无法转码的情况
2014/04/30 Javascript
JavaScript动态创建form表单并提交的实现方法
2015/12/10 Javascript
jQuery ajax提交Form表单实例(附demo源码)
2016/04/06 Javascript
jQuery事件委托之Safari
2016/07/05 Javascript
js实现淡入淡出轮播切换功能
2017/01/13 Javascript
JS中Swiper的使用和轮播图效果
2017/08/11 Javascript
使用Vue的slot插槽分发父组件内容实现高度复用、更加灵活的组件(推荐)
2018/05/01 Javascript
浅谈Webpack打包优化技巧
2018/06/12 Javascript
使用vue2.6实现抖音【时间轮盘】屏保效果附源码
2019/04/24 Javascript
Layui表格行工具事件与数据回填方法
2019/09/13 Javascript
vue data变量相互赋值后被实时同步的解决步骤
2020/08/05 Javascript
使用Python设置tmpfs来加速项目的教程
2015/04/17 Python
编写Python小程序来统计测试脚本的关键字
2016/03/12 Python
python实现中文转换url编码的方法
2016/06/14 Python
解决已经安装requests,却依然提示No module named requests问题
2018/05/18 Python
详解Python如何生成词云的方法
2018/06/01 Python
python 不同方式读取文件速度不同的实例
2018/11/09 Python
python使用Plotly绘图工具绘制散点图、线形图
2019/04/02 Python
使用Python和Prometheus跟踪天气的使用方法
2019/05/06 Python
python实现beta分布概率密度函数的方法
2019/07/08 Python
Python SQLAlchemy库的使用方法
2020/10/13 Python
Python使用grequests并发发送请求的示例
2020/11/05 Python
12个不为大家熟知的HTML5设计小技巧
2016/06/02 HTML / CSS
Shopee马来西亚:随拍即卖,最佳行动电商拍卖平台
2017/06/05 全球购物
美国最大的存储市场:SpareFoot
2018/07/23 全球购物
一家专门经营包包的英国网站:MyBag
2019/09/08 全球购物
品质管理部岗位职责范文
2014/03/01 职场文书
大学生励志演讲稿
2014/04/25 职场文书
优秀的应届生自荐信
2014/05/23 职场文书
乡镇一岗双责责任书
2015/01/29 职场文书
vue-cli3.x配置全局的scss的时候报错问题及解决
2022/04/30 Vue.js