python统计文本字符串里单词出现频率的方法


Posted in Python onMay 26, 2015

本文实例讲述了python统计文本字符串里单词出现频率的方法。分享给大家供大家参考。具体实现方法如下:

# word frequency in a text
# tested with Python24  vegaseat  25aug2005
# Chinese wisdom ...
str1 = """Man who run in front of car, get tired.
Man who run behind car, get exhausted."""
print "Original string:"
print str1
print
# create a list of words separated at whitespaces
wordList1 = str1.split(None)
# strip any punctuation marks and build modified word list
# start with an empty list
wordList2 = []
for word1 in wordList1:
  # last character of each word
  lastchar = word1[-1:]
  # use a list of punctuation marks
  if lastchar in [",", ".", "!", "?", ";"]:
    word2 = word1.rstrip(lastchar)
  else:
    word2 = word1
  # build a wordList of lower case modified words
  wordList2.append(word2.lower())
print "Word list created from modified string:"
print wordList2
print
# create a wordfrequency dictionary
# start with an empty dictionary
freqD2 = {}
for word2 in wordList2:
  freqD2[word2] = freqD2.get(word2, 0) + 1
# create a list of keys and sort the list
# all words are lower case already
keyList = freqD2.keys()
keyList.sort()
print "Frequency of each word in the word list (sorted):"
for key2 in keyList:
 print "%-10s %d" % (key2, freqD2[key2])

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python获取豆瓣电影简介代码分享
Jan 16 Python
python实现html转ubb代码(html2ubb)
Jul 03 Python
Python实现删除Android工程中的冗余字符串
Jan 19 Python
Python函数式编程指南(四):生成器详解
Jun 24 Python
Python算术运算符实例详解
May 31 Python
matplotlib调整子图间距,调整整体空白的方法
Aug 03 Python
python调用c++ ctype list传数组或者返回数组的方法
Feb 13 Python
Django 使用easy_thumbnails压缩上传的图片方法
Jul 26 Python
解决Django加载静态资源失败的问题
Jul 28 Python
Spring实战之使用util:命名空间简化配置操作示例
Dec 09 Python
Python爬虫抓取论坛关键字过程解析
Oct 19 Python
Python偏函数实现原理及应用
Nov 20 Python
python通过get,post方式发送http请求和接收http响应的方法
May 26 #Python
python使用urllib2提交http post请求的方法
May 26 #Python
Python同时向控制台和文件输出日志logging的方法
May 26 #Python
python实现查找excel里某一列重复数据并且剔除后打印的方法
May 26 #Python
python使用正则表达式提取网页URL的方法
May 26 #Python
python获取指定路径下所有指定后缀文件的方法
May 26 #Python
python通过apply使用元祖和列表调用函数实例
May 26 #Python
You might like
PHP的分页功能
2007/03/21 PHP
php分页函数示例代码分享
2014/02/24 PHP
php查询mysql数据库并将结果保存到数组的方法
2015/03/18 PHP
kindeditor 加入七牛云上传的实例讲解
2017/11/12 PHP
PHP 多任务秒级定时器的实现方法
2018/05/13 PHP
PHP7.1实现的AES与RSA加密操作示例
2018/06/15 PHP
jscript之List Excel Color Values
2007/06/13 Javascript
javascript Firefox与IE 替换节点的方法
2010/02/24 Javascript
javascript unicode与GBK2312(中文)编码转换方法
2013/11/14 Javascript
JS实现文字链接感应鼠标淡入淡出改变颜色的方法
2015/02/26 Javascript
javascript日期验证之输入日期大于等于当前日期
2015/12/13 Javascript
深入理解Angular2 模板语法
2016/08/07 Javascript
关于微信上网页图片点击全屏放大效果
2016/12/19 Javascript
详解PHP中pathinfo()函数导致的安全问题
2017/01/05 Javascript
基于Swiper实现移动端页面图片轮播效果
2017/12/28 Javascript
js最实用string(字符串)类型的使用及截取与拼接详解
2019/04/26 Javascript
vue.js实现回到顶部动画效果
2019/07/31 Javascript
Vue+Element UI+vue-quill-editor富文本编辑器及插入图片自定义
2019/08/20 Javascript
跟老齐学Python之集合(set)
2014/09/24 Python
pandas将DataFrame的列变成行索引的方法
2018/04/10 Python
python3下使用cv2.imwrite存储带有中文路径图片的方法
2018/05/10 Python
使用selenium模拟登录解决滑块验证问题的实现
2019/05/10 Python
python实现统计代码行数的小工具
2019/09/19 Python
Tensorflow安装问题: Could not find a version that satisfies the requirement tensorflow
2020/04/20 Python
Python类super()及私有属性原理解析
2020/06/15 Python
Python3爬虫里关于识别微博宫格验证码的知识点详解
2020/07/30 Python
Python pip使用超时问题解决方案
2020/08/03 Python
anaconda3安装及jupyter环境配置全教程
2020/08/24 Python
纯HTML5+CSS3制作图片旋转
2016/01/12 HTML / CSS
Bealls Florida百货商店:生活服饰、家居装饰和鞋子
2018/02/23 全球购物
介绍一下Prototype的$()函数,$F()函数,$A()函数都是什么作用?
2014/03/05 面试题
职业女性的职业规划
2014/03/04 职场文书
最经典的大学生职业生涯规划范文
2014/03/05 职场文书
委托代理人授权委托书范本
2014/09/24 职场文书
2015年小学教导处工作总结
2015/05/26 职场文书
python3.7.2 tkinter entry框限定输入数字的操作
2021/05/22 Python