Python中文分词实现方法(安装pymmseg)


Posted in Python onJune 14, 2016

本文实例讲述了Python中文分词实现方法。分享给大家供大家参考,具体如下:

在Python这pymmseg-cpp 还是十分方便的!

环境 ubuntu10.04 , python2.65

步骤:

1 下载mmseg-cpp的源代码 http://code.google.com/p/pymmseg-cpp/

2 执行:

tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录
cd pymmseg\mmseg-cpp
python build.py   #生成 mmseg.so文件

3 将 pymmseg 目录复制到 /usr/local/lib/python2.6/dist-packages 中

4 测试有没有成功:

test.py文件:

from pymmseg import mmseg
mmseg.dict_load_defaults()
text = '今天的天气真好啊,我们一起出去玩一下吧'
algor = mmseg.Algorithm(text)
for tok in algor:
  print '%s [%d..%d]' % (tok.text, tok.start, tok.end)

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
简单介绍Python中的try和finally和with方法
May 05 Python
在Django框架中运行Python应用全攻略
Jul 17 Python
Python中在脚本中引用其他文件函数的实现方法
Jun 23 Python
Python利用ElementTree模块处理XML的方法详解
Aug 31 Python
PyQt5 pyqt多线程操作入门
May 05 Python
pandas对dataFrame中某一个列的数据进行处理的方法
Jul 08 Python
浅谈keras的深度模型训练过程及结果记录方式
Jan 24 Python
pycharm内无法import已安装的模块问题解决
Feb 12 Python
Django数据库操作之save与update的使用
Apr 01 Python
python主要用于哪些方向
Jul 05 Python
Python实现一个简单的递归下降分析器
Aug 01 Python
Pycharm Git 设置方法
Sep 15 Python
Python找出list中最常出现元素的方法
Jun 14 #Python
Python中列表元素转为数字的方法分析
Jun 14 #Python
python实现中文转换url编码的方法
Jun 14 #Python
Python的Django框架中消息通知的计数器实现教程
Jun 13 #Python
详解Python的Flask框架中的signals信号机制
Jun 13 #Python
Python的Flask站点中集成xhEditor文本编辑器的教程
Jun 13 #Python
Flask的图形化管理界面搭建框架Flask-Admin的使用教程
Jun 13 #Python
You might like
php下把数组保存为文件格式的实例应用
2010/02/08 PHP
PHP字符串处理的10个简单方法
2010/06/30 PHP
php smarty截取中文字符乱码问题?gb2312/utf-8
2011/11/07 PHP
Javascript hasOwnProperty 方法 & in 关键字
2008/11/26 Javascript
jquery 子窗口操作父窗口的代码
2009/09/21 Javascript
简单的Jquery遮罩层代码实例
2013/11/14 Javascript
深入理解JavaScript是如何实现继承的
2013/12/12 Javascript
JavaScript中使用Object.create()创建对象介绍
2014/12/30 Javascript
Javascript核心读书有感之词法结构
2015/02/01 Javascript
javascript实现的猜数小游戏完整实例代码
2016/05/10 Javascript
JavaScript Promise 用法
2016/06/14 Javascript
jQuery checkbox选中问题之prop与attr注意点分析
2016/11/15 Javascript
javascript实现右下角广告框效果
2017/02/01 Javascript
Node.js微信 access_token ( jsapi_ticket ) 存取与刷新的示例
2017/09/30 Javascript
Angularjs添加排序查询功能的实例代码
2017/10/24 Javascript
详解通过源码解析Node.js中cluster模块的主要功能实现
2018/05/16 Javascript
js实现移动端tab切换时下划线滑动效果
2019/09/08 Javascript
jQuery实现鼠标放置名字上显示详细内容气泡提示框效果的方法分析
2020/04/04 jQuery
微信小程序实现打卡签到页面
2020/09/21 Javascript
[05:31]DOTA2英雄梦之声_第04期_光之守卫
2014/06/23 DOTA
[45:18]2018DOTA2亚洲邀请赛 4.3 突围赛 Optic vs iG 第一场
2018/04/04 DOTA
基于python中pygame模块的Linux下安装过程(详解)
2017/11/09 Python
python requests.post带head和body的实例
2019/01/02 Python
tensorflow 利用expand_dims和squeeze扩展和压缩tensor维度方式
2020/02/07 Python
Python图像处理库PIL的ImageGrab模块介绍详解
2020/02/26 Python
PyQt5 界面显示无响应的实现
2020/03/26 Python
Keras 切换后端方式(Theano和TensorFlow)
2020/06/19 Python
css3 background属性调整增强介绍
2010/12/18 HTML / CSS
加拿大国民体育购物网站:National Sports
2018/11/04 全球购物
JavaScript获取当前url根目录(路径)
2014/02/19 面试题
建筑专业自荐信范文
2014/01/05 职场文书
业务员自荐信范文
2014/04/20 职场文书
工作说明书格式
2014/07/29 职场文书
在职员工证明书
2014/09/19 职场文书
小学语文教师研修日志
2015/11/13 职场文书
python tqdm用法及实例详解
2021/06/16 Python