Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
介绍Python中的__future__模块
Apr 27 Python
Python利用ElementTree模块处理XML的方法详解
Aug 31 Python
计算机二级python学习教程(3) python语言基本数据类型
May 16 Python
python爬虫神器Pyppeteer入门及使用
Jul 13 Python
python 实现在shell窗口中编写print不向屏幕输出
Feb 19 Python
python查找特定名称文件并按序号、文件名分行打印输出的方法
Apr 24 Python
使用PyQt的QLabel组件实现选定目标框功能的方法示例
May 19 Python
Python的历史与优缺点整理
May 26 Python
解决Keras中CNN输入维度报错问题
Jun 29 Python
python 使用三引号时容易犯的小错误
Oct 21 Python
Django执行源生mysql语句实现过程解析
Nov 12 Python
教你使用Python pypinyin库实现汉字转拼音
May 27 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
一个自定义位数的php多用户计数器代码
2007/03/11 PHP
php 正则 过滤html 的超链接
2009/06/02 PHP
thinkphp3查询mssql数据库乱码解决方法分享
2014/02/11 PHP
全面解析PHP面向对象的三大特征
2017/06/10 PHP
Javascript 通过json自动生成Dom的代码
2010/04/01 Javascript
基于jquery的关于动态创建DOM元素的问题
2010/12/24 Javascript
非主流的textarea自增长实现js代码
2011/12/20 Javascript
js实现简单折叠、展开菜单的方法
2015/08/28 Javascript
jQuery插件ImageDrawer.js实现动态绘制图片动画(附源码下载)
2016/02/25 Javascript
用js动态添加html元素,以及属性的简单实例
2016/07/19 Javascript
深入理解Angular2 模板语法
2016/08/07 Javascript
js仿微信公众平台打标签功能
2017/04/08 Javascript
vue项目打包部署到服务器的方法示例
2018/08/27 Javascript
详解如何模拟实现node中的Events模块(通俗易懂版)
2019/04/15 Javascript
微信小程序发布新版本时自动提示用户更新的方法
2019/06/07 Javascript
vue2.0项目集成Cesium的实现方法
2019/07/30 Javascript
javascript使用正则表达式实现注册登入校验
2020/09/23 Javascript
[01:50:49]DOTA2-DPC中国联赛 正赛 PSG.LGD vs Aster BO3 第三场 1月24日
2021/03/11 DOTA
深入解析Python中的变量和赋值运算符
2015/10/12 Python
Python3.4实现远程控制电脑开关机
2018/02/22 Python
解决Python2.7读写文件中的中文乱码问题
2018/04/12 Python
python在回调函数中获取返回值的方法
2019/02/22 Python
django数据库自动重连的方法实例
2019/07/21 Python
Python流程控制 if else实现解析
2019/09/02 Python
美国球鞋寄卖网站:Stadium Goods
2018/05/09 全球购物
几个Shell Script面试题
2014/04/18 面试题
无偿献血倡议书
2014/04/14 职场文书
《少年王勃》教学反思
2014/04/27 职场文书
解放思想演讲稿
2014/09/11 职场文书
2014年库房工作总结
2014/11/26 职场文书
晚会开幕词范文
2016/03/04 职场文书
安全责任协议书范本
2016/03/23 职场文书
68句权威创业名言
2019/08/26 职场文书
创业计划书之美容店
2019/09/16 职场文书
python pygame入门教程
2021/06/01 Python
嵌入式Redis服务器在Spring Boot测试中的使用教程
2021/07/21 Redis