编程 Python

Python jieba库分词模式实例用法

Posted in Python onJanuary 13, 2021

在中文分词中，jiebe库是最为常见的，主要的原因还是它独特的支持分词模式如：精确模式、全模式、搜索引擎模式。也对应着三种方式，包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式，以及方法的使用，一起来了解下吧。

全模式：

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式：

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式：

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式：" + "/ ".join(seg_list))
print("精确模式：" + "/ ".join(seg_list1))
print("搜索引擎模式：" + "/ ".join(seg_list2))

输出结果：

全模式：南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式：南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式：南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展：

获取词性

我们还可以通过jiaba这个库把词性进行区分，比如动词，名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Python jieba库分词模式实例用法

- Author -

十一

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

高性能web服务器框架Tornado简单实现restful接口及开发实例

Jul 16 Python

python使用装饰器和线程限制函数执行时间的方法

Apr 18 Python

Python网络编程中urllib2模块的用法总结

Jul 12 Python

python爬虫实现教程转换成 PDF 电子书

Feb 19 Python

详解Python中的静态方法与类成员方法

Feb 28 Python

python中pandas.DataFrame对行与列求和及添加新行与列示例

Mar 12 Python

python Django框架实现web端分页呈现数据

Oct 31 Python

Django集成celery发送异步邮件实例

Dec 17 Python

Python连接字符串过程详解

Jan 06 Python

Python&&GDAL实现NDVI的计算方式

Jan 09 Python

Django ModelForm组件原理及用法详解

Oct 12 Python

OpenCV中resize函数插值算法的实现过程(五种)

Jun 05 Python

python中yield的用法详解

Jan 13 #Python

利用python+request通过接口实现人员通行记录上传功能

Jan 13 #Python

selenium如何定位span元素的实现

Jan 13 #Python

python 进制转换 int、bin、oct、hex的原理

Jan 13 #Python

python pillow库的基础使用教程

Jan 13 #Python

用python-webdriver实现自动填表的示例代码

Jan 13 #Python

python 装饰器的基本使用

Jan 13 #Python

You might like

神族 Protoss 剧情介绍

2020/03/14 星际争霸

php获取bing每日壁纸示例分享

2014/02/25 PHP

php通过ajax实现双击table修改内容

2014/04/28 PHP

PHP实现向关联数组指定的Key之前插入元素的方法

2017/06/06 PHP

360搜索引擎自动收录php改写方案

2018/04/28 PHP

Yii框架自定义数据库操作组件示例

2019/11/11 PHP

Javascript 强制类型转换函数

2009/05/17 Javascript

在vs2010中调试javascript代码方法

2011/02/11 Javascript

jQuery EasyUI API 中文文档 - TimeSpinner时间微调器

2011/10/23 Javascript

二叉树的非递归后序遍历算法实例详解

2014/02/07 Javascript

JavaScript开发人员的10个关键习惯小结

2014/12/05 Javascript

理解javascript回调函数

2014/12/28 Javascript

javascript中加var和不加var的区别你真的懂吗

2016/01/06 Javascript

百度地图JavascriptApi Marker平滑移动及车头指向行径方向

2017/03/13 Javascript

vue.js整合vux中的上拉加载下拉刷新实例教程

2018/01/09 Javascript

Windows下Node爬虫神器Puppeteer安装记

2019/01/09 Javascript

浅谈JS的原型和继承

2019/05/08 Javascript

React 父子组件通信的实现方法

2019/12/05 Javascript

使用Mock.js生成前端测试数据

2020/12/13 Javascript

Python协程的用法和例子详解

2017/09/09 Python

Windows下Anaconda的安装和简单使用方法

2018/01/04 Python

Anaconda下安装mysql-python的包实例

2018/06/11 Python

Python3中函数参数传递方式实例详解

2019/05/05 Python

利用anaconda保证64位和32位的python共存

2021/03/09 Python

tensorflow 2.0模式下训练的模型转成 tf1.x 版本的pb模型实例

2020/06/22 Python

PHP面试题及答案二

2015/05/23 面试题

广告学专业推荐信范文

2013/11/23 职场文书

预备党员的自我评价

2014/03/12 职场文书

大学生英语演讲稿

2014/04/24 职场文书

教师自我剖析材料（群众路线）

2014/09/29 职场文书

自制短波长线天线频率预选器 - 成功消除B2K之流的镜像

2021/04/22 无线电

element多个表单校验的实现

2021/05/27 Javascript

Oracle11g r2 卸载干净重装的详细教程(亲测有效已重装过)

2021/06/04 Oracle

详解Python内置模块Collections

2022/03/22 Python

MySQL数据库表约束讲解

2022/06/21 MySQL