Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
高性能web服务器框架Tornado简单实现restful接口及开发实例
Jul 16 Python
python使用装饰器和线程限制函数执行时间的方法
Apr 18 Python
Python网络编程中urllib2模块的用法总结
Jul 12 Python
python爬虫实现教程转换成 PDF 电子书
Feb 19 Python
详解Python中的静态方法与类成员方法
Feb 28 Python
python中pandas.DataFrame对行与列求和及添加新行与列示例
Mar 12 Python
python Django框架实现web端分页呈现数据
Oct 31 Python
Django集成celery发送异步邮件实例
Dec 17 Python
Python连接字符串过程详解
Jan 06 Python
Python&&GDAL实现NDVI的计算方式
Jan 09 Python
Django ModelForm组件原理及用法详解
Oct 12 Python
OpenCV中resize函数插值算法的实现过程(五种)
Jun 05 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
神族 Protoss 剧情介绍
2020/03/14 星际争霸
php获取bing每日壁纸示例分享
2014/02/25 PHP
php通过ajax实现双击table修改内容
2014/04/28 PHP
PHP实现向关联数组指定的Key之前插入元素的方法
2017/06/06 PHP
360搜索引擎自动收录php改写方案
2018/04/28 PHP
Yii框架自定义数据库操作组件示例
2019/11/11 PHP
Javascript 强制类型转换函数
2009/05/17 Javascript
在vs2010中调试javascript代码方法
2011/02/11 Javascript
jQuery EasyUI API 中文文档 - TimeSpinner时间微调器
2011/10/23 Javascript
二叉树的非递归后序遍历算法实例详解
2014/02/07 Javascript
JavaScript开发人员的10个关键习惯小结
2014/12/05 Javascript
理解javascript回调函数
2014/12/28 Javascript
javascript中加var和不加var的区别 你真的懂吗
2016/01/06 Javascript
百度地图JavascriptApi Marker平滑移动及车头指向行径方向
2017/03/13 Javascript
vue.js整合vux中的上拉加载下拉刷新实例教程
2018/01/09 Javascript
Windows下Node爬虫神器Puppeteer安装记
2019/01/09 Javascript
浅谈JS的原型和继承
2019/05/08 Javascript
React 父子组件通信的实现方法
2019/12/05 Javascript
使用Mock.js生成前端测试数据
2020/12/13 Javascript
Python协程的用法和例子详解
2017/09/09 Python
Windows下Anaconda的安装和简单使用方法
2018/01/04 Python
Anaconda下安装mysql-python的包实例
2018/06/11 Python
Python3中函数参数传递方式实例详解
2019/05/05 Python
利用anaconda保证64位和32位的python共存
2021/03/09 Python
tensorflow 2.0模式下训练的模型转成 tf1.x 版本的pb模型实例
2020/06/22 Python
PHP面试题及答案二
2015/05/23 面试题
广告学专业推荐信范文
2013/11/23 职场文书
预备党员的自我评价
2014/03/12 职场文书
大学生英语演讲稿
2014/04/24 职场文书
教师自我剖析材料(群众路线)
2014/09/29 职场文书
自制短波长线天线频率预选器 - 成功消除B2K之流的镜像
2021/04/22 无线电
element多个表单校验的实现
2021/05/27 Javascript
Oracle11g r2 卸载干净重装的详细教程(亲测有效已重装过)
2021/06/04 Oracle
详解Python内置模块Collections
2022/03/22 Python
MySQL数据库表约束讲解
2022/06/21 MySQL