Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中的默认参数详解
Jun 24 Python
在Django的视图中使用数据库查询的方法
Jul 16 Python
简单介绍Python中的几种数据类型
Jan 02 Python
关于Python中Inf与Nan的判断问题详解
Feb 08 Python
Python实现统计代码行的方法分析
Jul 12 Python
Linux-ubuntu16.04 Python3.5配置OpenCV3.2的方法
Apr 02 Python
python+pandas生成指定日期和重采样的方法
Apr 11 Python
详解python实现小波变换的一个简单例子
Jul 18 Python
详解Python中的正斜杠与反斜杠
Aug 09 Python
在Pytorch中使用样本权重(sample_weight)的正确方法
Aug 17 Python
Python基础之元类详解
Apr 29 Python
Pandas搭配lambda组合使用详解
Jan 22 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
自动生成文章摘要的代码[PHP 版本]
2007/03/20 PHP
PHP+MySQL 手工注入语句大全 推荐
2009/10/30 PHP
浅析SVN常见问题及解决方法
2013/06/21 PHP
用PHP和Shell写Hadoop的MapReduce程序
2014/04/15 PHP
yii操作cookie实例简介
2014/07/09 PHP
ThinkPHP基于PHPExcel导入Excel文件的方法
2014/10/15 PHP
Javascript的构造函数和constructor属性
2010/01/09 Javascript
基于jquery的放大镜效果
2012/05/30 Javascript
js切换光标示例代码
2013/10/10 Javascript
Javascript实现带关闭按钮的网页漂浮广告代码
2014/01/12 Javascript
EasyUI创建对话框的两种方式
2016/08/23 Javascript
js判断所有表单项不为空则提交表单的实现方法
2016/09/09 Javascript
bootstrap 模态框(modal)实现水平垂直居中显示
2017/01/23 Javascript
jquery.guide.js新版上线操作向导镂空提示jQuery插件(推荐)
2017/05/20 jQuery
JS中使用media实现响应式布局
2017/08/04 Javascript
Node.js  事件循环详解及实例
2017/08/06 Javascript
jqueryUI tab标签页代码分享
2017/10/09 jQuery
vue 图片裁剪上传组件的实现
2020/11/12 Javascript
vue实现抽屉弹窗效果
2020/11/15 Javascript
[57:55]完美世界DOTA2联赛PWL S3 Magma vs Phoenix 第二场 12.12
2020/12/16 DOTA
python实现自动更换ip的方法
2015/05/05 Python
解决Ubuntu pip 安装 mysql-python包出错的问题
2018/06/11 Python
python微信撤回监测代码
2019/04/29 Python
用Pytorch训练CNN(数据集MNIST,使用GPU的方法)
2019/08/19 Python
Python获取excel内容及相关操作代码实例
2020/08/10 Python
Python爬取12306车次信息代码详解
2020/08/12 Python
Window10上Tensorflow的安装(CPU和GPU版本)
2020/12/15 Python
css3实现wifi信号逐渐增强效果实例
2017/08/09 HTML / CSS
iKRIX意大利网上商店:男女豪华服装和配件
2019/10/09 全球购物
会计电算化专业毕业生自荐信
2013/12/20 职场文书
《青山处处埋忠骨》教学反思
2014/04/22 职场文书
今冬明春火灾防控工作方案
2014/05/29 职场文书
常务副总经理任命书
2014/06/05 职场文书
申报优秀教师材料
2014/12/16 职场文书
五年级语文教学反思
2016/03/03 职场文书
2019奶茶店创业计划书范本,值得你借鉴
2019/08/14 职场文书