Python smallseg分词用法实例分析


Posted in Python onMay 28, 2015

本文实例讲述了Python smallseg分词用法。分享给大家供大家参考。具体分析如下:

#encoding=utf-8 
#import psyco 
#psyco.full() 
words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] 
from smallseg import SEG 
seg = SEG() 
print('Load dict...') 
seg.set(words) 
print("Dict is OK.") 
def cuttest(text): 
  wlist = seg.cut(text) 
  wlist.reverse() 
  tmp = " ".join(wlist) 
  print(tmp) 
  print("================================") 
if __name__=="__main__": 
  cuttest("这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。") 
  cuttest("我不喜欢日本和服。") 
  cuttest("雷猴回归人间。") 
  cuttest("工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作") 
  cuttest("我需要廉租房") 
  cuttest("永和服装饰品有限公司") 
  cuttest("我爱北京天安门") 
  cuttest("abc") 
  cuttest("隐马尔可夫") 
  cuttest("雷猴是个好网站") 
  cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成") 
  cuttest("草泥马和欺实马是今年的流行词汇") 
  cuttest("伊藤洋华堂总府店") 
  cuttest("中国科学院计算技术研究所") 
  cuttest("罗密欧与朱丽叶") 
  cuttest("我购买了道具和服装")

smallseg分词,在python3.3上运行稍微有些问题。py代码xrange在3.*中已经改名字为range了。另外,3.*中也没有decode函数了。

修改了上面的两个地方,代码就可移植性了。效果还可以。

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python3.0 字典key排序
Dec 24 Python
Python自动登录126邮箱的方法
Jul 10 Python
利用python批量检查网站的可用性
Sep 09 Python
详解python中 os._exit() 和 sys.exit(), exit(0)和exit(1) 的用法和区别
Jun 23 Python
pandas series序列转化为星期几的实例
Apr 11 Python
pytorch 在网络中添加可训练参数,修改预训练权重文件的方法
Aug 17 Python
django formset实现数据表的批量操作的示例代码
Dec 06 Python
pycharm通过ssh连接远程服务器教程
Feb 12 Python
python使用建议与技巧分享(二)
Aug 17 Python
浅谈对python中if、elif、else的误解
Aug 20 Python
python爬取音频下载的示例代码
Oct 19 Python
Python模拟登录requests.Session应用详解
Nov 17 Python
Python基于smtplib实现异步发送邮件服务
May 28 #Python
Python使用Scrapy爬取妹子图
May 28 #Python
Python实现统计单词出现的个数
May 28 #Python
Python下载懒人图库JavaScript特效
May 28 #Python
Python实现给qq邮箱发送邮件的方法
May 28 #Python
Python import用法以及与from...import的区别
May 28 #Python
Python中使用不同编码读写txt文件详解
May 28 #Python
You might like
PHP版自动生成文章摘要
2008/07/23 PHP
使用php+Ajax实现唯一校验实现代码[简单应用]
2011/11/29 PHP
php中mysql连接和基本操作代码(快速测试使用,简单方便)
2014/04/25 PHP
php按字符无乱码截取中文的方法
2015/03/27 PHP
php实现的RSS生成类实例
2015/04/23 PHP
RequireJS入门一之实现第一个例子
2015/09/30 Javascript
基于jQuery实现多标签页切换的效果(web前端开发)
2016/07/24 Javascript
JavaScript箭头函数_动力节点Java学院整理
2017/06/28 Javascript
详解vue 模拟后台数据(加载本地json文件)调试
2017/08/25 Javascript
Angularjs渲染的 using 指令的星级评分系统示例
2017/11/09 Javascript
Router解决跨模块下的页面跳转示例
2018/01/11 Javascript
小程序实现左滑删除效果
2019/07/25 Javascript
Javascript 对象(object)合并操作实例分析
2019/07/30 Javascript
Webpack3+React16代码分割的实现
2021/03/03 Javascript
[48:47]VGJ.S vs NB 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
Python处理XML格式数据的方法详解
2017/03/21 Python
Python数据分析之如何利用pandas查询数据示例代码
2017/09/01 Python
unittest+coverage单元测试代码覆盖操作实例详解
2018/04/04 Python
python和opencv实现抠图
2018/07/18 Python
Python 字符串类型列表转换成真正列表类型过程解析
2019/08/26 Python
解决导入django_filters不成功问题No module named 'django_filter'
2020/07/15 Python
Jmeter调用Python脚本实现参数互相传递的实现
2021/01/22 Python
墨西哥皇宫度假村预订:Palace Resorts
2018/06/16 全球购物
Viking比利时:购买办公用品
2019/10/30 全球购物
将n个数按输入顺序的逆序排列,用函数实现
2012/11/14 面试题
办公室保洁员岗位职责
2013/12/02 职场文书
中式面点餐厅创业计划书
2014/01/29 职场文书
个人实习生的自我评价
2014/02/16 职场文书
公安机关纪律作风整顿个人剖析材料材料
2014/10/10 职场文书
安娜卡列尼娜观后感
2015/06/11 职场文书
早上好问候语大全
2015/11/10 职场文书
创业项目大全(适合在家创业的项目)
2019/08/15 职场文书
提升Nginx性能的一些建议
2021/03/31 Servers
一篇带你入门Java垃圾回收器
2021/06/16 Java/Android
JS 基本概念详细介绍
2021/10/16 Javascript
MySQL如何使备份得数据保持一致
2022/05/02 MySQL