Python中文分词实现方法(安装pymmseg)


Posted in Python onJune 14, 2016

本文实例讲述了Python中文分词实现方法。分享给大家供大家参考,具体如下:

在Python这pymmseg-cpp 还是十分方便的!

环境 ubuntu10.04 , python2.65

步骤:

1 下载mmseg-cpp的源代码 http://code.google.com/p/pymmseg-cpp/

2 执行:

tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录
cd pymmseg\mmseg-cpp
python build.py   #生成 mmseg.so文件

3 将 pymmseg 目录复制到 /usr/local/lib/python2.6/dist-packages 中

4 测试有没有成功:

test.py文件:

from pymmseg import mmseg
mmseg.dict_load_defaults()
text = '今天的天气真好啊,我们一起出去玩一下吧'
algor = mmseg.Algorithm(text)
for tok in algor:
  print '%s [%d..%d]' % (tok.text, tok.start, tok.end)

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
无法使用pip命令安装python第三方库的原因及解决方法
Jun 12 Python
pandas通过索引进行排序的示例
Nov 16 Python
Python中的元组介绍
Jan 28 Python
Python实现查找字符串数组最长公共前缀示例
Mar 27 Python
python中时间转换datetime和pd.to_datetime详析
Aug 11 Python
详解Python中打乱列表顺序random.shuffle()的使用方法
Nov 11 Python
在Python中字符串、列表、元组、字典之间的相互转换
Nov 15 Python
解决python 读取 log日志的编码问题
Dec 24 Python
Python使用Tkinter实现转盘抽奖器的步骤详解
Jan 06 Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 Python
python如何调用百度识图api
Sep 29 Python
python安装mysql的依赖包mysql-python操作
Jan 01 Python
Python找出list中最常出现元素的方法
Jun 14 #Python
Python中列表元素转为数字的方法分析
Jun 14 #Python
python实现中文转换url编码的方法
Jun 14 #Python
Python的Django框架中消息通知的计数器实现教程
Jun 13 #Python
详解Python的Flask框架中的signals信号机制
Jun 13 #Python
Python的Flask站点中集成xhEditor文本编辑器的教程
Jun 13 #Python
Flask的图形化管理界面搭建框架Flask-Admin的使用教程
Jun 13 #Python
You might like
PHP foreach遍历多维数组实现方式
2016/11/16 PHP
PHP实现的分解质因数操作示例
2018/08/01 PHP
javascript里模拟sleep(两种实现方式)
2013/01/25 Javascript
Javascript模拟加速运动与减速运动代码分享
2014/12/11 Javascript
javascript实现通过表格绘制颜色填充矩形的方法
2015/04/21 Javascript
jquery通过扩展select控件实现支持enter或focus选择的方法
2015/11/19 Javascript
浅析jquery如何判断滚动条滚到页面底部并执行事件
2016/04/29 Javascript
jquery动态切换背景图片的简单实现方法
2016/05/14 Javascript
AngularJS入门教程之数据绑定原理详解
2016/11/02 Javascript
jQuery Mobile和HTML5开发App推广注册页
2016/11/07 Javascript
easyUI实现类似搜索框关键词自动提示功能示例代码
2016/12/27 Javascript
vue如何使用 Slot 分发内容实例详解
2017/09/05 Javascript
小程序scroll-view组件实现滚动的示例代码
2018/09/20 Javascript
layui表格设计以及数据初始化详解
2019/10/26 Javascript
jQuery插件simplePagination的使用方法示例
2020/04/28 jQuery
编写Python脚本使得web页面上的代码高亮显示
2015/04/24 Python
在Python中使用全局日志时需要注意的问题
2015/05/06 Python
Python通过正则表达式选取callback的方法
2015/07/18 Python
python3使用PyMysql连接mysql数据库实例
2017/02/07 Python
django manage.py扩展自定义命令方法
2018/05/27 Python
Python中的枚举类型示例介绍
2019/01/09 Python
python中matplotlib条件背景颜色的实现
2019/09/02 Python
基于pytorch的lstm参数使用详解
2020/01/14 Python
对python中 math模块下 atan 和 atan2的区别详解
2020/01/17 Python
解决pytorch-yolov3 train 报错的问题
2020/02/18 Python
python 串行执行和并行执行实例
2020/04/30 Python
Django Path转换器自定义及正则代码实例
2020/05/29 Python
Python爬虫防封ip的一些技巧
2020/08/06 Python
金牌葡萄酒俱乐部:Gold Medal Wine Club
2017/11/02 全球购物
关于学习的演讲稿
2014/05/10 职场文书
小学先进集体事迹材料
2014/05/31 职场文书
2015商场元旦促销活动策划方案
2014/12/09 职场文书
2015年行政人事部工作总结
2015/05/13 职场文书
MySQL安装后默认自带数据库的作用详解
2021/04/27 MySQL
Oracle 死锁的检测查询及处理
2021/09/25 Oracle
HDFS免重启挂载新磁盘
2022/04/06 Servers