编程 Python

python实现统计文本中单词出现的频率详解

Posted in Python onMay 20, 2019

本文实例为大家分享了python统计文本中单词出现频率的具体代码，供大家参考，具体内容如下

#coding=utf-8
import os
from collections import Counter
sumsdata=[]
for fname in os.listdir(os.getcwd()):
  if os.path.isfile(fname) and fname.endswith('.txt'):
    with open(fname,'r') as fp:
      data=fp.readlines()
    sumsdata+=[line.strip().lower() for line in data]
cnt=Counter()
for word in sumsdata:
  cnt[word]+=1
cnt=dict(cnt)
for key,value in cnt.items():
  print(key+":"+str(value))

首先在和程序所在路径下创建几个文本文件，我建了两个，文件内容分别为hello python goodbye python 和 i like python。运行程序，得到以下结果

以上所述是小编给大家介绍的python统计文本中单词出现频率详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持！

python实现统计文本中单词出现的频率详解

- Author -

ls_6468

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

基于python实现微信模板消息

Dec 21 Python

Python网络编程中urllib2模块的用法总结

Jul 12 Python

理解Python中的绝对路径和相对路径

Aug 30 Python

Python中if elif else及缩进的使用简述

May 31 Python

python多进程使用及线程池的使用方法代码详解

Oct 24 Python

django项目登录中使用图片验证码的实现方法

Aug 15 Python

numpy.array 操作使用简单总结

Nov 08 Python

python的time模块和datetime模块实例解析

Nov 29 Python

Pytorch 实现focal_loss 多类别和二分类示例

Jan 14 Python

在Keras中实现保存和加载权重及模型结构

Jun 15 Python

tensorflow下的图片标准化函数per_image_standardization用法

Jun 30 Python

树莓派升级python的具体步骤

Jul 05 Python

详解Python字符串切片

May 20 #Python

Django中ORM外键和表的关系详解

May 20 #Python

利用Django模版生成树状结构实例代码

May 19 #Python

使用Python3内置文档高效学习以及官方中文文档

May 19 #Python

python反编译学习之字节码详解

May 19 #Python

python从入门到精通 windows安装python图文教程

May 18 #Python

详解用Python实现自动化监控远程服务器

May 18 #Python

You might like

apache rewrite_module模块使用教程

2008/01/10 PHP

php连接mysql之mysql_connect()与mysqli_connect()的区别

2020/07/19 PHP

PHP dirname(__FILE__)原理及用法解析

2020/10/28 PHP

javascript下string.format函数补充

2010/08/24 Javascript

javascript中match函数的用法小结

2014/02/08 Javascript

JS实现不使用图片仿Windows右键菜单效果代码

2015/10/22 Javascript

JS动态的把左边列表添加到右边的实现代码(可上下移动)

2016/11/17 Javascript

react-router JS 控制路由跳转实例

2017/06/15 Javascript

基于Taro的微信小程序模板消息-获取formId功能模块封装实践

2019/07/15 Javascript

javascript中的相等操作符(==与===区别)

2019/12/21 Javascript

基于p5.js 2D图像接口的扩展（交互实现）

2020/11/30 Javascript

python中使用urllib2获取http请求状态码的代码例子

2014/07/07 Python

Python 正则表达式实现计算器功能

2017/04/29 Python

利用python将图片转换成excel文档格式

2017/12/30 Python

Python操作Redis之设置key的过期时间实例代码

2018/01/25 Python

Linux系统（CentOS）下python2.7.10安装

2018/09/26 Python

Python机器学习之scikit-learn库中KNN算法的封装与使用方法

2018/12/14 Python

wxpython绘制圆角窗体

2019/11/18 Python

PyTorch中的padding(边缘填充)操作方式

2020/01/03 Python

深入了解Python 方法之类方法 & 静态方法

2020/08/17 Python

OpenCV读取与写入图片的实现

2020/10/13 Python

用python写PDF转换器的实现

2020/10/29 Python

Python用Jira库来操作Jira

2020/12/28 Python

使用HTML5 Canvas API绘制弧线的教程

2016/03/22 HTML / CSS

Waterford加拿大官方网站：世界著名的水晶杯品牌

2016/11/01 全球购物

英国领先的狗和宠物美容专家：Christies Direct

2017/04/03 全球购物

英国厨房与餐具用品为主的设计品牌：Joseph Joseph

2018/04/26 全球购物

城市观光通行证：The Sightseeing Pass

2018/04/28 全球购物

华为的Java面试题

2014/03/07 面试题

效能监察建议书

2014/05/19 职场文书

勿忘国耻9.18演讲稿（经典篇）

2014/09/14 职场文书

机关单位工作失职检讨书

2014/11/20 职场文书

房屋授权无偿使用证明

2014/11/29 职场文书

2015暑期社会实践调查报告

2015/07/14 职场文书

2016幼儿园教师年度考核评语

2015/12/01 职场文书

《没有任何借口》读后感：完美的执行能力

2020/01/07 职场文书