Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现的登录和操作开心网脚本分享
Jul 09 Python
tensorflow 恢复指定层与不同层指定不同学习率的方法
Jul 26 Python
Python编程在flask中模拟进行Restful的CRUD操作
Dec 28 Python
Python操作MySQL数据库的两种方式实例分析【pymysql和pandas】
Mar 18 Python
Python+selenium点击网页上指定坐标的实例
Jul 05 Python
Python3 使用map()批量的转换数据类型,如str转float的实现
Nov 29 Python
Python object类中的特殊方法代码讲解
Mar 06 Python
Win10下配置tensorflow-gpu的详细教程(无VS2015/2017)
Jul 14 Python
Python HTMLTestRunner如何下载生成报告
Sep 04 Python
Python爬取微信小程序通用方法代码实例详解
Sep 29 Python
pytorch简介
Nov 11 Python
浅析python字符串前加r、f、u、l 的区别
Jan 24 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
php下实现折线图效果的代码
2007/04/28 PHP
叫你如何修改Nginx与PHP的文件上传大小限制
2014/09/10 PHP
firefox firebug中文入门教程 脚本之家新年特别版
2010/01/02 Javascript
jquery 学习笔记一
2010/04/07 Javascript
jQuery Validation插件remote验证方式的Bug解决
2010/07/01 Javascript
Jquery之美中不足小结
2011/02/16 Javascript
6款经典实用的jQuery小插件及源码(对话框/提示工具等等)
2013/02/04 Javascript
jquery实现兼容浏览器的图片上传本地预览功能
2013/10/14 Javascript
使用GruntJS构建Web程序之Tasks(任务)篇
2014/06/06 Javascript
js获得当前系统日期时间的方法
2015/05/06 Javascript
JS实现网页Div层Clone拖拽效果
2015/09/26 Javascript
jQuery实现返回顶部功能
2016/02/23 Javascript
JS中用try catch对代码运行的性能影响分析
2016/12/26 Javascript
javascript replace()第二个参数为函数时的参数用法
2016/12/26 Javascript
JS实现标签页切换效果
2017/05/04 Javascript
AngularJS 限定$scope的范围实例详解
2017/06/23 Javascript
客户端(vue框架)与服务器(koa框架)通信及服务器跨域配置详解
2017/08/26 Javascript
微信小程序的注册页面包含倒计时验证码、获取用户信息
2019/05/22 Javascript
createObjectURL方法实现本地图片预览
2019/09/30 Javascript
python递归计算N!的方法
2015/05/05 Python
基于hashlib模块--加密(详解)
2017/06/21 Python
python DataFrame 修改列的顺序实例
2018/04/10 Python
Python爬虫的两套解析方法和四种爬虫实现过程
2018/07/20 Python
python快速编写单行注释多行注释的方法
2019/07/31 Python
python 使用while循环输出*组成的菱形实例
2020/04/12 Python
python中pandas库中DataFrame对行和列的操作使用方法示例
2020/06/14 Python
基于Keras中Conv1D和Conv2D的区别说明
2020/06/19 Python
css3实现的多级渐变下拉菜单导航效果代码
2015/08/31 HTML / CSS
LA MER海蓝之谜美国官网:传奇面霜
2016/08/27 全球购物
英国最大的汽车配件在线商店:Euro Car Parts
2019/09/30 全球购物
求职简历自我评价范例
2014/03/12 职场文书
经济信息系毕业生自荐信范文
2014/03/15 职场文书
保密工作责任书
2014/04/16 职场文书
我的梦想演讲稿500字
2014/08/21 职场文书
2014年保育员工作总结
2014/12/02 职场文书
2015年志愿者服务工作总结
2015/04/20 职场文书