python实现统计文本中单词出现的频率详解


Posted in Python onMay 20, 2019

本文实例为大家分享了python统计文本中单词出现频率的具体代码,供大家参考,具体内容如下

#coding=utf-8
import os
from collections import Counter
sumsdata=[]
for fname in os.listdir(os.getcwd()):
  if os.path.isfile(fname) and fname.endswith('.txt'):
    with open(fname,'r') as fp:
      data=fp.readlines()
    sumsdata+=[line.strip().lower() for line in data]
cnt=Counter()
for word in sumsdata:
  cnt[word]+=1
cnt=dict(cnt)
for key,value in cnt.items():
  print(key+":"+str(value))

首先在和程序所在路径下创建几个文本文件,我建了两个,文件内容分别为hello python goodbye python 和 i like python。运行程序,得到以下结果

python实现统计文本中单词出现的频率详解

以上所述是小编给大家介绍的python统计文本中单词出现频率详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
再谈Python中的字符串与字符编码(推荐)
Dec 14 Python
Python命令启动Web服务器实例详解
Feb 23 Python
python清理子进程机制剖析
Nov 23 Python
Python网络编程之TCP与UDP协议套接字用法示例
Feb 02 Python
使用Python读取二进制文件的实例讲解
Jul 09 Python
Python3.7实现中控考勤机自动连接
Aug 28 Python
详解python 模拟豆瓣登录(豆瓣6.0)
Apr 18 Python
Python3.5 Pandas模块缺失值处理和层次索引实例详解
Apr 23 Python
基于Numpy.convolve使用Python实现滑动平均滤波的思路详解
May 16 Python
PyQt5显示GIF图片的方法
Jun 17 Python
Python 使用folium绘制leaflet地图的实现方法
Jul 05 Python
Python加速程序运行的方法
Jul 29 Python
详解Python字符串切片
May 20 #Python
Django中ORM外键和表的关系详解
May 20 #Python
利用Django模版生成树状结构实例代码
May 19 #Python
使用Python3内置文档高效学习以及官方中文文档
May 19 #Python
python反编译学习之字节码详解
May 19 #Python
python从入门到精通 windows安装python图文教程
May 18 #Python
详解用Python实现自动化监控远程服务器
May 18 #Python
You might like
Smarty+QUICKFORM小小演示
2007/02/25 PHP
iis下php mail函数的sendmail配置方法(官方推荐)
2012/04/25 PHP
探讨php中header的用法详解
2013/06/07 PHP
php+html5实现无刷新图片上传教程
2016/01/22 PHP
利用php_imagick实现复古效果的方法
2016/10/18 PHP
CentOS系统中PHP安装扩展的方式汇总
2017/04/09 PHP
PHP排序算法之直接插入排序(Straight Insertion Sort)实例分析
2018/04/20 PHP
javascript不同页面传值的改进版
2008/09/30 Javascript
基于jquery的监控数据是否发生改变
2011/04/11 Javascript
js中一个函数获取另一个函数返回值问题探讨
2013/11/21 Javascript
用原生JS获取CLASS对象(很简单实用)
2014/10/15 Javascript
javascript中定义类的方法汇总
2014/12/28 Javascript
仅一个form表单 js实现注册信息依次填写提交功能
2016/06/12 Javascript
webpack4与babel配合使es6代码可运行于低版本浏览器的方法
2018/10/12 Javascript
在LayUI图片上传中,解决由跨域问题引起的请求接口错误的方法
2019/09/24 Javascript
nodejs dgram模块广播+组播的实现示例
2019/11/04 NodeJs
浅谈vue权限管理实现及流程
2020/04/23 Javascript
[05:11]TI9战队采访——VIRTUSPRO
2019/08/22 DOTA
基python实现多线程网页爬虫
2015/09/06 Python
Python简单定义与使用字典dict的方法示例
2017/07/25 Python
Python3正则匹配re.split,re.finditer及re.findall函数用法详解
2018/06/11 Python
Python 字符串换行的多种方式
2018/09/06 Python
Python 按字典dict的键排序,并取出相应的键值放于list中的实例
2019/02/12 Python
python视频按帧截取图片工具
2019/07/23 Python
python 解决flask uwsgi 获取不到全局变量的问题
2019/12/22 Python
tensorflow查看ckpt各节点名称实例
2020/01/21 Python
在Anaconda3下使用清华镜像源安装TensorFlow(CPU版)
2020/04/19 Python
学生实习介绍信
2014/01/15 职场文书
信息专业毕业生五年职业规划参考
2014/02/06 职场文书
个人贷款担保书
2014/04/01 职场文书
环保倡议书400字
2014/05/15 职场文书
艾滋病宣传标语
2014/06/25 职场文书
2014党员学习兰辉先进事迹思想汇报
2014/09/17 职场文书
政审证明范文
2015/06/19 职场文书
理解深度学习之深度学习简介
2021/04/14 Python
python 三边测量定位的实现代码
2021/04/22 Python