Python smallseg分词用法实例分析


Posted in Python onMay 28, 2015

本文实例讲述了Python smallseg分词用法。分享给大家供大家参考。具体分析如下:

#encoding=utf-8 
#import psyco 
#psyco.full() 
words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] 
from smallseg import SEG 
seg = SEG() 
print('Load dict...') 
seg.set(words) 
print("Dict is OK.") 
def cuttest(text): 
  wlist = seg.cut(text) 
  wlist.reverse() 
  tmp = " ".join(wlist) 
  print(tmp) 
  print("================================") 
if __name__=="__main__": 
  cuttest("这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。") 
  cuttest("我不喜欢日本和服。") 
  cuttest("雷猴回归人间。") 
  cuttest("工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作") 
  cuttest("我需要廉租房") 
  cuttest("永和服装饰品有限公司") 
  cuttest("我爱北京天安门") 
  cuttest("abc") 
  cuttest("隐马尔可夫") 
  cuttest("雷猴是个好网站") 
  cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成") 
  cuttest("草泥马和欺实马是今年的流行词汇") 
  cuttest("伊藤洋华堂总府店") 
  cuttest("中国科学院计算技术研究所") 
  cuttest("罗密欧与朱丽叶") 
  cuttest("我购买了道具和服装")

smallseg分词,在python3.3上运行稍微有些问题。py代码xrange在3.*中已经改名字为range了。另外,3.*中也没有decode函数了。

修改了上面的两个地方,代码就可移植性了。效果还可以。

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
几个提升Python运行效率的方法之间的对比
Apr 03 Python
用Python登录Gmail并发送Gmail邮件的教程
Apr 17 Python
Python设计足球联赛赛程表程序的思路与简单实现示例
Jun 28 Python
Python实现简易Web爬虫详解
Jan 03 Python
利用python如何处理百万条数据(适用java新手)
Jun 06 Python
关于python2 csv写入空白行的问题
Jun 22 Python
Python实现的简单读写csv文件操作示例
Jul 12 Python
在Python中通过getattr获取对象引用的方法
Jan 21 Python
python scatter散点图用循环分类法加图例
Mar 19 Python
python数据类型之间怎么转换技巧分享
Aug 20 Python
解决Windows下python和pip命令无法使用的问题
Aug 31 Python
python urllib和urllib3知识点总结
Feb 08 Python
Python基于smtplib实现异步发送邮件服务
May 28 #Python
Python使用Scrapy爬取妹子图
May 28 #Python
Python实现统计单词出现的个数
May 28 #Python
Python下载懒人图库JavaScript特效
May 28 #Python
Python实现给qq邮箱发送邮件的方法
May 28 #Python
Python import用法以及与from...import的区别
May 28 #Python
Python中使用不同编码读写txt文件详解
May 28 #Python
You might like
使用PHP导出Word文档的原理和实例
2013/10/21 PHP
php中array_slice和array_splice函数解析
2016/10/18 PHP
javascript document.referrer 用法
2009/04/30 Javascript
[原创]IE view-source 无法查看看源码 JavaScript看网页源码
2009/07/19 Javascript
js数据验证集合、js email验证、js url验证、js长度验证、js数字验证等简单封装
2010/05/15 Javascript
IE8对JS通过属性和数组遍历解析不一样的地方探讨
2013/05/06 Javascript
JS中getYear()和getFullYear()区别分析
2014/07/04 Javascript
JavaScript字符串对象replace方法实例(用于字符串替换或正则替换)
2014/10/16 Javascript
js实现向右横向滑出的二级菜单效果
2015/08/27 Javascript
基于Jquery实现万圣节快乐特效
2015/11/01 Javascript
JavaScript使用Range调色及透明度实例
2016/09/25 Javascript
Vue.js 2.0 和 React、Augular等其他前端框架大比拼
2016/10/08 Javascript
Vue.js组件使用开发实例教程
2016/11/01 Javascript
简单实现jQuery弹幕效果
2017/05/06 jQuery
JS中的数组转变成JSON格式字符串的方法
2017/05/09 Javascript
nodejs结合Socket.IO实现的即时通讯功能详解
2018/01/12 NodeJs
JavaScript new对象的四个过程实例浅析
2018/07/31 Javascript
详解vue使用插槽分发内容slot的用法
2019/03/28 Javascript
JS根据Unix时间戳显示发布时间是多久前【项目实测】
2019/07/10 Javascript
JS代码屏蔽F12,右键,粘贴,复制,剪切,选中,操作实例
2019/09/17 Javascript
小程序实现录音上传功能
2019/11/22 Javascript
js实现登录拖拽窗口
2020/02/10 Javascript
文章或博客自动生成章节目录索引(支持三级)的实现代码
2020/05/10 Javascript
[58:15]2018DOTA2亚洲邀请赛 4.1 小组赛 A组 NB vs Liquid
2018/04/02 DOTA
[01:07:20]DOTA2-DPC中国联赛 正赛 Dynasty vs XG BO3 第二场 2月2日
2021/03/11 DOTA
Python unittest模块用法实例分析
2018/05/25 Python
caffe binaryproto 与 npy相互转换的实例讲解
2018/07/09 Python
django 发送邮件和缓存的实现代码
2018/07/18 Python
浅谈Python爬虫原理与数据抓取
2020/07/21 Python
中国京东和泰国中央集团合资的网站:JD CENTRAL
2020/08/22 全球购物
装修致歉信
2014/01/15 职场文书
《一株紫丁香》教学反思
2014/02/19 职场文书
客服部班长工作责任制
2014/02/25 职场文书
七一建党节慰问信
2015/02/14 职场文书
保险内勤岗位职责
2015/04/13 职场文书
2016幼儿园毕业感言
2015/12/08 职场文书