Python smallseg分词用法实例分析


Posted in Python onMay 28, 2015

本文实例讲述了Python smallseg分词用法。分享给大家供大家参考。具体分析如下:

#encoding=utf-8 
#import psyco 
#psyco.full() 
words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] 
from smallseg import SEG 
seg = SEG() 
print('Load dict...') 
seg.set(words) 
print("Dict is OK.") 
def cuttest(text): 
  wlist = seg.cut(text) 
  wlist.reverse() 
  tmp = " ".join(wlist) 
  print(tmp) 
  print("================================") 
if __name__=="__main__": 
  cuttest("这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。") 
  cuttest("我不喜欢日本和服。") 
  cuttest("雷猴回归人间。") 
  cuttest("工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作") 
  cuttest("我需要廉租房") 
  cuttest("永和服装饰品有限公司") 
  cuttest("我爱北京天安门") 
  cuttest("abc") 
  cuttest("隐马尔可夫") 
  cuttest("雷猴是个好网站") 
  cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成") 
  cuttest("草泥马和欺实马是今年的流行词汇") 
  cuttest("伊藤洋华堂总府店") 
  cuttest("中国科学院计算技术研究所") 
  cuttest("罗密欧与朱丽叶") 
  cuttest("我购买了道具和服装")

smallseg分词,在python3.3上运行稍微有些问题。py代码xrange在3.*中已经改名字为range了。另外,3.*中也没有decode函数了。

修改了上面的两个地方,代码就可移植性了。效果还可以。

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
简析Python的闭包和装饰器
Feb 26 Python
教你用python3根据关键词爬取百度百科的内容
Aug 18 Python
centos6.7安装python2.7.11的具体方法
Jan 16 Python
Python实现判断并移除列表指定位置元素的方法
Apr 13 Python
matplotlib调整子图间距,调整整体空白的方法
Aug 03 Python
详解Pandas之容易让人混淆的行选择和列选择
Jul 10 Python
pytorch 输出中间层特征的实例
Aug 17 Python
Python 识别12306图片验证码物品的实现示例
Jan 20 Python
Django分组聚合查询实例分享
Apr 29 Python
Python正则表达式如何匹配中文
May 27 Python
Pytorch mask-rcnn 实现细节分享
Jun 24 Python
Python PIL按比例裁剪图片
May 11 Python
Python基于smtplib实现异步发送邮件服务
May 28 #Python
Python使用Scrapy爬取妹子图
May 28 #Python
Python实现统计单词出现的个数
May 28 #Python
Python下载懒人图库JavaScript特效
May 28 #Python
Python实现给qq邮箱发送邮件的方法
May 28 #Python
Python import用法以及与from...import的区别
May 28 #Python
Python中使用不同编码读写txt文件详解
May 28 #Python
You might like
PHP生成树的方法
2015/07/28 PHP
javaScript 判断字符串是否为数字的简单方法
2009/07/25 Javascript
IE 下的只读 innerHTML
2009/08/21 Javascript
关于URL中的特殊符号使用介绍
2011/11/03 Javascript
JavaScript数字和字符串转换示例
2014/03/26 Javascript
jquery做的一个简单的屏幕锁定提示框
2014/03/26 Javascript
基于jQuery实现返回顶部实例代码
2016/01/01 Javascript
原生js仿jquery animate动画效果
2016/07/13 Javascript
bootstrap弹出层的多种触发方式
2017/05/10 Javascript
webpack2.0配置postcss-loader的方法
2017/08/17 Javascript
es6中的解构赋值、扩展运算符和rest参数使用详解
2017/09/28 Javascript
简单明了区分escape、encodeURI和encodeURIComponent
2018/05/26 Javascript
微信小程序开发之自定义tabBar的实现
2018/09/06 Javascript
angular 表单验证器验证的同时限制输入的实现
2019/04/11 Javascript
详解JS实现简单的时分秒倒计时代码
2019/04/25 Javascript
python判断字符串是否包含子字符串的方法
2015/03/24 Python
在Python中使用poplib模块收取邮件的教程
2015/04/29 Python
mac 安装python网络请求包requests方法
2018/06/13 Python
Laravel框架表单验证格式化输出的方法
2019/09/25 Python
pytorch-神经网络拟合曲线实例
2020/01/15 Python
tensorflow模型转ncnn的操作方式
2020/05/25 Python
Python数据相关系数矩阵和热力图轻松实现教程
2020/06/16 Python
python 制作python包,封装成可用模块教程
2020/07/13 Python
2014年圣诞节倒计时网页的制作过程
2014/12/05 HTML / CSS
垃圾回收的优点和原理
2014/05/16 面试题
质检员的岗位职责
2013/11/15 职场文书
毕业设计计划书
2014/01/09 职场文书
成龙霸王洗发水广告词
2014/03/14 职场文书
中介业务员岗位职责
2014/04/09 职场文书
《画风》教学反思
2014/04/16 职场文书
技术股份合作协议书
2014/10/05 职场文书
就业推荐表自我评价范文
2015/03/02 职场文书
2015年销售工作总结范文
2015/03/30 职场文书
2015年反洗钱工作总结
2015/04/25 职场文书
公司致全体员工的感谢信
2019/06/24 职场文书
尝试使用Python爬取城市租房信息
2022/04/12 Python