python实现统计文本中单词出现的频率详解


Posted in Python onMay 20, 2019

本文实例为大家分享了python统计文本中单词出现频率的具体代码,供大家参考,具体内容如下

#coding=utf-8
import os
from collections import Counter
sumsdata=[]
for fname in os.listdir(os.getcwd()):
  if os.path.isfile(fname) and fname.endswith('.txt'):
    with open(fname,'r') as fp:
      data=fp.readlines()
    sumsdata+=[line.strip().lower() for line in data]
cnt=Counter()
for word in sumsdata:
  cnt[word]+=1
cnt=dict(cnt)
for key,value in cnt.items():
  print(key+":"+str(value))

首先在和程序所在路径下创建几个文本文件,我建了两个,文件内容分别为hello python goodbye python 和 i like python。运行程序,得到以下结果

python实现统计文本中单词出现的频率详解

以上所述是小编给大家介绍的python统计文本中单词出现频率详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
简单介绍Python中的struct模块
Apr 28 Python
python实现批量下载新浪博客的方法
Jun 15 Python
Python编程实现正则删除命令功能
Aug 30 Python
Python实现将Excel转换成为image的方法
Oct 23 Python
python通过配置文件共享全局变量的实例
Jan 11 Python
Python中正则表达式的用法总结
Feb 22 Python
Pytorch实现基于CharRNN的文本分类与生成示例
Jan 08 Python
python 实现字符串下标的输出功能
Feb 13 Python
Python sqlite3查询操作过程解析
Feb 20 Python
屏蔽Django admin界面添加按钮的操作
Mar 11 Python
Python使用xlrd实现读取合并单元格
Jul 09 Python
深度学习tensorflow基础mnist
Apr 14 Python
详解Python字符串切片
May 20 #Python
Django中ORM外键和表的关系详解
May 20 #Python
利用Django模版生成树状结构实例代码
May 19 #Python
使用Python3内置文档高效学习以及官方中文文档
May 19 #Python
python反编译学习之字节码详解
May 19 #Python
python从入门到精通 windows安装python图文教程
May 18 #Python
详解用Python实现自动化监控远程服务器
May 18 #Python
You might like
快速开发一个PHP扩展图文教程
2008/12/12 PHP
php小偷相关截取函数备忘
2010/11/28 PHP
php替换超长文本中的特殊字符的函数代码
2012/05/22 PHP
PHP快速导出百万级数据到CSV或者EXCEL文件
2020/11/27 PHP
php中get_object_vars()在数组的实例用法
2021/02/22 PHP
日期 时间js控件
2009/05/07 Javascript
基于JQuery的模拟苹果桌面Dock效果(稳定版)
2012/10/15 Javascript
javascript获取xml节点的最大值(实现代码)
2013/12/11 Javascript
JS应用正则表达式转换大小写示例
2014/09/18 Javascript
简单介绍JavaScript的变量和数据类型
2015/06/03 Javascript
js中对函数设置默认参数值的3种方法
2015/10/23 Javascript
AngularJS实践之使用ng-repeat中$index的注意点
2016/12/22 Javascript
JS查找字符串中出现最多的字符及个数统计
2017/02/04 Javascript
Javascript中引用类型传递的知识点小结
2017/03/06 Javascript
vue2.0的contextmenu右键弹出菜单的实例代码
2017/07/24 Javascript
在vue项目中集成graphql(vue-ApolloClient)
2018/09/08 Javascript
微信小程序的开发范式BeautyWe.js入门详解
2019/07/10 Javascript
浅析JavaScript预编译和暗示全局变量
2020/09/03 Javascript
antd配置config-overrides.js文件的操作
2020/10/31 Javascript
echarts浮动显示单位的实现方法示例
2020/12/04 Javascript
[02:27]《DAC最前线》之附加赛征程
2015/01/29 DOTA
跟老齐学Python之变量和参数
2014/10/10 Python
Python中第三方库Requests库的高级用法详解
2017/03/12 Python
python实现ID3决策树算法
2017/12/20 Python
python中的set实现不重复的排序原理
2018/01/24 Python
Python 多个图同时在不同窗口显示的实现方法
2019/07/07 Python
丹麦优惠购物网站:PLUSSHOP
2019/03/24 全球购物
MyBag中文网:英国著名的时尚包袋电商零售网站
2020/07/31 全球购物
党的群众路线教育实践活动宣传标语口号
2014/06/06 职场文书
学习朴航瑛老师爱岗敬业先进事迹思想汇报
2014/09/17 职场文书
警察群众路线对照检查材料思想汇报
2014/10/01 职场文书
学校2015年纠风工作总结
2015/05/15 职场文书
2015年第31个教师节致辞
2015/07/31 职场文书
生活委员竞选稿
2015/11/21 职场文书
2019XX公司员工考核管理制度!
2019/08/07 职场文书
Python 中数组和数字相乘时的注意事项说明
2021/05/10 Python