python统计文本字符串里单词出现频率的方法


Posted in Python onMay 26, 2015

本文实例讲述了python统计文本字符串里单词出现频率的方法。分享给大家供大家参考。具体实现方法如下:

# word frequency in a text
# tested with Python24  vegaseat  25aug2005
# Chinese wisdom ...
str1 = """Man who run in front of car, get tired.
Man who run behind car, get exhausted."""
print "Original string:"
print str1
print
# create a list of words separated at whitespaces
wordList1 = str1.split(None)
# strip any punctuation marks and build modified word list
# start with an empty list
wordList2 = []
for word1 in wordList1:
  # last character of each word
  lastchar = word1[-1:]
  # use a list of punctuation marks
  if lastchar in [",", ".", "!", "?", ";"]:
    word2 = word1.rstrip(lastchar)
  else:
    word2 = word1
  # build a wordList of lower case modified words
  wordList2.append(word2.lower())
print "Word list created from modified string:"
print wordList2
print
# create a wordfrequency dictionary
# start with an empty dictionary
freqD2 = {}
for word2 in wordList2:
  freqD2[word2] = freqD2.get(word2, 0) + 1
# create a list of keys and sort the list
# all words are lower case already
keyList = freqD2.keys()
keyList.sort()
print "Frequency of each word in the word list (sorted):"
for key2 in keyList:
 print "%-10s %d" % (key2, freqD2[key2])

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python3实现的腾讯微博自动发帖小工具
Nov 11 Python
在Python中进行自动化单元测试的教程
Apr 15 Python
深入浅析Python中join 和 split详解(推荐)
Jun 30 Python
一个月入门Python爬虫学习,轻松爬取大规模数据
Jan 03 Python
详解python使用pip安装第三方库(工具包)速度慢、超时、失败的解决方案
Dec 02 Python
基于Tensorflow使用CPU而不用GPU问题的解决
Feb 07 Python
python+opencv3生成一个自定义纯色图教程
Feb 19 Python
Django ValuesQuerySet转json方式
Mar 16 Python
解决Keras中Embedding层masking与Concatenate层不可调和的问题
Jun 18 Python
Python with语句用法原理详解
Jul 03 Python
Python中使用Selenium环境安装的方法步骤
Feb 22 Python
python基础入门之普通操作与函数(三)
Jun 13 Python
python通过get,post方式发送http请求和接收http响应的方法
May 26 #Python
python使用urllib2提交http post请求的方法
May 26 #Python
Python同时向控制台和文件输出日志logging的方法
May 26 #Python
python实现查找excel里某一列重复数据并且剔除后打印的方法
May 26 #Python
python使用正则表达式提取网页URL的方法
May 26 #Python
python获取指定路径下所有指定后缀文件的方法
May 26 #Python
python通过apply使用元祖和列表调用函数实例
May 26 #Python
You might like
PHPMailer 中文使用说明小结
2010/01/22 PHP
php去掉文件前几行的方法
2015/07/29 PHP
php自定义时间转换函数示例
2016/12/07 PHP
详解EventDispatcher事件分发组件
2016/12/25 PHP
PHP高精确度运算BC函数库实例详解
2017/08/15 PHP
PHP pthreads v3下同步处理synchronized用法示例
2020/02/21 PHP
Save a File Using a File Save Dialog Box
2007/06/18 Javascript
javascript 建设银行登陆键盘
2008/06/10 Javascript
使用jQuery的ajax功能实现的RSS Reader 代码
2009/09/03 Javascript
创建你的第一个AngularJS应用的方法
2015/06/16 Javascript
一个简单不报错的summernote 图片上传案例
2016/07/11 Javascript
URL中“#” “?” &“”号的作用浅析
2017/02/04 Javascript
基于ES6 Array.of的用法(实例讲解)
2017/09/05 Javascript
React Native使用fetch实现图片上传的示例代码
2018/03/07 Javascript
JavaScript实现读取与输出XML文件数据的方法示例
2018/06/05 Javascript
如何使用CSS3+JQuery实现悬浮墙式菜单
2019/06/18 jQuery
vue resource发送请求的几种方式
2019/09/30 Javascript
浅谈VUE中演示v-for为什么要加key
2020/01/16 Javascript
Python实现计算文件夹下.h和.cpp文件的总行数
2015/04/23 Python
python执行等待程序直到第二天零点的方法
2015/04/23 Python
Python中使用OpenCV库来进行简单的气象学遥感影像计算
2016/02/19 Python
Python实现的异步代理爬虫及代理池
2017/03/17 Python
python中nan与inf转为特定数字方法示例
2017/05/11 Python
python爬虫入门教程--优雅的HTTP库requests(二)
2017/05/25 Python
Django rest framework基本介绍与代码示例
2018/01/26 Python
Python实现连接两个无规则列表后删除重复元素并升序排序的方法
2018/02/05 Python
浅谈pytorch torch.backends.cudnn设置作用
2020/02/20 Python
美国知名珠宝首饰品牌:Gemvara
2017/10/06 全球购物
科颜氏香港官方网店:Kiehl’s香港
2021/03/07 全球购物
幼儿园师德演讲稿
2014/05/06 职场文书
科级干部群众路线教育实践活动对照检查材料思想汇报
2014/09/20 职场文书
格列夫游记读书笔记
2015/07/01 职场文书
高三毕业感言
2015/07/30 职场文书
2019银行员工个人工作自我鉴定
2019/06/27 职场文书
导游词之山海关
2019/12/10 职场文书
Mybatis-plus配置分页插件返回统一结果集
2022/06/21 Java/Android