python统计文本字符串里单词出现频率的方法


Posted in Python onMay 26, 2015

本文实例讲述了python统计文本字符串里单词出现频率的方法。分享给大家供大家参考。具体实现方法如下:

# word frequency in a text
# tested with Python24  vegaseat  25aug2005
# Chinese wisdom ...
str1 = """Man who run in front of car, get tired.
Man who run behind car, get exhausted."""
print "Original string:"
print str1
print
# create a list of words separated at whitespaces
wordList1 = str1.split(None)
# strip any punctuation marks and build modified word list
# start with an empty list
wordList2 = []
for word1 in wordList1:
  # last character of each word
  lastchar = word1[-1:]
  # use a list of punctuation marks
  if lastchar in [",", ".", "!", "?", ";"]:
    word2 = word1.rstrip(lastchar)
  else:
    word2 = word1
  # build a wordList of lower case modified words
  wordList2.append(word2.lower())
print "Word list created from modified string:"
print wordList2
print
# create a wordfrequency dictionary
# start with an empty dictionary
freqD2 = {}
for word2 in wordList2:
  freqD2[word2] = freqD2.get(word2, 0) + 1
# create a list of keys and sort the list
# all words are lower case already
keyList = freqD2.keys()
keyList.sort()
print "Frequency of each word in the word list (sorted):"
for key2 in keyList:
 print "%-10s %d" % (key2, freqD2[key2])

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
浅析python 中__name__ = '__main__' 的作用
Jul 05 Python
python简单获取本机计算机名和IP地址的方法
Jun 03 Python
Python中的字符串查找操作方法总结
Jun 27 Python
python基于twisted框架编写简单聊天室
Jan 02 Python
python读取视频流提取视频帧的两种方法
Oct 22 Python
Python多线程处理实例详解【单进程/多进程】
Jan 30 Python
django 使用 PIL 压缩图片的例子
Aug 16 Python
Python上下文管理器类和上下文管理器装饰器contextmanager用法实例分析
Nov 07 Python
python 输出列表元素实例(以空格/逗号为分隔符)
Dec 25 Python
django表单中的按钮获取数据的实例分析
Jul 31 Python
Python词云的正确实现方法实例
May 08 Python
Python使用BeautifulSoup4修改网页内容
May 20 Python
python通过get,post方式发送http请求和接收http响应的方法
May 26 #Python
python使用urllib2提交http post请求的方法
May 26 #Python
Python同时向控制台和文件输出日志logging的方法
May 26 #Python
python实现查找excel里某一列重复数据并且剔除后打印的方法
May 26 #Python
python使用正则表达式提取网页URL的方法
May 26 #Python
python获取指定路径下所有指定后缀文件的方法
May 26 #Python
python通过apply使用元祖和列表调用函数实例
May 26 #Python
You might like
PHP中call_user_func_array()函数的用法演示
2012/02/05 PHP
php对称加密算法示例
2014/05/07 PHP
PHP基本语法实例总结
2016/09/09 PHP
javascript 火狐(firefox)不显示本地图片问题解决
2008/07/05 Javascript
jquery动态加载select下拉框示例代码
2013/12/10 Javascript
JS获取地址栏参数的几种方法小结
2014/02/28 Javascript
jQuery中:button选择器用法实例
2015/01/04 Javascript
精通JavaScript的this关键字
2020/05/28 Javascript
Bootstrap源码解读按钮(5)
2016/12/23 Javascript
javascript使用btoa和atob来进行Base64转码和解码
2017/03/20 Javascript
使用JavaScriptCore实现OC和JS交互详解
2017/03/28 Javascript
微信小程序富文本渲染引擎的详解
2017/09/30 Javascript
CSS3结合jQuery实现动画效果及回调函数的实例
2017/12/27 jQuery
Vue slot用法(小结)
2018/10/22 Javascript
Vant的安装和配合引入Vue.js项目里的方法步骤
2018/12/05 Javascript
3分钟了解vue数据劫持的原理实现
2019/05/01 Javascript
小程序分享链接onShareAppMessage的具体用法
2020/05/22 Javascript
js实现无缝轮播图插件封装
2020/07/31 Javascript
[56:56]VG vs LGD 2019国际邀请赛淘汰赛 胜者组 BO3 第一场 8.22
2019/09/05 DOTA
[01:02:26]DOTA2-DPC中国联赛 正赛 SAG vs RNG BO3 第二场 1月18日
2021/03/11 DOTA
Python函数参数类型*、**的区别
2015/04/11 Python
python中itertools模块zip_longest函数详解
2018/06/12 Python
Pandas过滤dataframe中包含特定字符串的数据方法
2018/11/07 Python
python语言基本语句用法总结
2019/06/11 Python
pandas DataFrame 交集并集补集的实现
2019/06/24 Python
Django model select的多种用法详解
2019/07/16 Python
关于python tushare Tkinter构建的简单股票可视化查询系统(Beta v0.13)
2020/10/19 Python
CSS3转换功能transform主要属性值分析及实现分享
2012/05/06 HTML / CSS
恒华伟业笔试面试题
2015/02/26 面试题
护理职业应聘自荐书
2013/09/29 职场文书
批评与自我批评材料
2014/02/15 职场文书
《珍珠泉》教学反思
2014/02/20 职场文书
储备店长岗位职责
2015/04/14 职场文书
python图像处理基本操作总结(PIL库、Matplotlib及Numpy)
2021/06/08 Python
Python实现日志实时监测的示例详解
2022/04/06 Python
教你使用Ubuntu搭建DNS服务器
2022/09/23 Servers