Python smallseg分词用法实例分析


Posted in Python onMay 28, 2015

本文实例讲述了Python smallseg分词用法。分享给大家供大家参考。具体分析如下:

#encoding=utf-8 
#import psyco 
#psyco.full() 
words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] 
from smallseg import SEG 
seg = SEG() 
print('Load dict...') 
seg.set(words) 
print("Dict is OK.") 
def cuttest(text): 
  wlist = seg.cut(text) 
  wlist.reverse() 
  tmp = " ".join(wlist) 
  print(tmp) 
  print("================================") 
if __name__=="__main__": 
  cuttest("这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。") 
  cuttest("我不喜欢日本和服。") 
  cuttest("雷猴回归人间。") 
  cuttest("工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作") 
  cuttest("我需要廉租房") 
  cuttest("永和服装饰品有限公司") 
  cuttest("我爱北京天安门") 
  cuttest("abc") 
  cuttest("隐马尔可夫") 
  cuttest("雷猴是个好网站") 
  cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成") 
  cuttest("草泥马和欺实马是今年的流行词汇") 
  cuttest("伊藤洋华堂总府店") 
  cuttest("中国科学院计算技术研究所") 
  cuttest("罗密欧与朱丽叶") 
  cuttest("我购买了道具和服装")

smallseg分词,在python3.3上运行稍微有些问题。py代码xrange在3.*中已经改名字为range了。另外,3.*中也没有decode函数了。

修改了上面的两个地方,代码就可移植性了。效果还可以。

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python类和函数中使用静态变量的方法
May 09 Python
Python合并字符串的3种方法
May 21 Python
解决Pycharm无法import自己安装的第三方module问题
May 18 Python
python检索特定内容的文本文件实例
Jun 05 Python
python爬取微信公众号文章
Aug 31 Python
PyQt打开保存对话框的方法和使用详解
Feb 27 Python
基于python实现蓝牙通信代码实例
Nov 19 Python
python3 动态模块导入与全局变量使用实例
Dec 22 Python
python PIL/cv2/base64相互转换实例
Jan 09 Python
PyQt使用QPropertyAnimation开发简单动画
Apr 02 Python
使用keras内置的模型进行图片预测实例
Jun 17 Python
Python 整行读取文本方法并去掉readlines换行\n操作
Sep 03 Python
Python基于smtplib实现异步发送邮件服务
May 28 #Python
Python使用Scrapy爬取妹子图
May 28 #Python
Python实现统计单词出现的个数
May 28 #Python
Python下载懒人图库JavaScript特效
May 28 #Python
Python实现给qq邮箱发送邮件的方法
May 28 #Python
Python import用法以及与from...import的区别
May 28 #Python
Python中使用不同编码读写txt文件详解
May 28 #Python
You might like
在php MYSQL中插入当前时间
2008/04/06 PHP
nginx+php-fpm配置文件的组织结构介绍
2012/11/07 PHP
ECMall支持SSL连接邮件服务器的配置方法详解
2014/05/19 PHP
swoole和websocket简单聊天室开发
2017/11/18 PHP
TP5框架实现的数据库备份功能示例
2020/04/05 PHP
关于javascript 回调函数中变量作用域的讨论
2009/09/11 Javascript
jquery插件 cluetip 关键词注释
2010/01/12 Javascript
javascript for循环设法提高性能
2010/02/24 Javascript
javascript 全等号运算符使用说明
2010/05/31 Javascript
写js时遇到的一些小问题
2010/12/06 Javascript
jQuery简单实现两级下拉菜单效果代码
2015/09/15 Javascript
Extjs 点击复选框在表格中增加相关信息行
2016/07/12 Javascript
JavaScript中的编码和解码函数
2017/02/15 Javascript
浅谈Vue数据绑定的原理
2018/01/08 Javascript
打通前后端构建一个Vue+Express的开发环境
2018/07/17 Javascript
electron实现静默打印的示例代码
2019/08/12 Javascript
JS Ajax请求会话过期处理问题解决方法分析
2019/11/16 Javascript
Vue + Scss 动态切换主题颜色实现换肤的示例代码
2020/04/27 Javascript
JS如何实现手机端输入验证码效果
2020/05/13 Javascript
超详细小程序定位地图模块全系列开发教学
2020/11/24 Javascript
使用Python编写提取日志中的中文的脚本的方法
2015/04/30 Python
Python中实现三目运算的方法
2015/06/21 Python
Python数据可视化教程之Matplotlib实现各种图表实例
2019/01/13 Python
python用opencv批量截取图像指定区域的方法
2019/01/24 Python
Python3 执行系统命令并获取实时回显功能
2019/07/09 Python
详解HTML5中的Communication API基本使用方法
2016/01/29 HTML / CSS
Bench加拿大官方网站:英国城市服装品牌
2017/11/03 全球购物
美国女士内衣在线折扣商店:One Hanes Place
2019/03/24 全球购物
吉列剃须刀英国官网:Gillette英国
2019/03/28 全球购物
波兰购物网站:MALL.PL
2019/05/01 全球购物
员工年终自我评价
2014/09/14 职场文书
临时用工协议书范本
2014/10/29 职场文书
2014年后勤管理工作总结
2014/12/01 职场文书
2014年留守儿童工作总结
2014/12/10 职场文书
告知书格式
2015/07/01 职场文书
浅谈Python响应式类库RxPy
2021/06/14 Python