python统计文章中单词出现次数实例


Posted in Python onFebruary 27, 2020

python统计单词出现次数

做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。

下面是具体的实现代码,实现了从importthis.txt文件读取单词,并统计出现次数最多的5个单词。

# -*- coding:utf-8 -*-
import io
import re
 
class Counter:
  def __init__(self, path):
    """
    :param path: 文件路径
    """
    self.mapping = dict()
    with io.open(path, encoding="utf-8") as f:
      data = f.read()
      words = [s.lower() for s in re.findall("\w+", data)]
      for word in words:
        self.mapping[word] = self.mapping.get(word, 0) + 1
 
  def most_common(self, n):
    assert n > 0, "n should be large than 0"
    return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]
 
if __name__ == '__main__':
  most_common_5 = Counter("importthis.txt").most_common(5)
  for item in most_common_5:
    print(item)

执行效果:

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

知识点补充

1、如何正确读写文件

2、如何对数据进行排序

3、字典数据类型的运用

4、正则表达式的运用

到此这篇关于python统计文章中单词出现次数实例的文章就介绍到这了,更多相关python统计单词出现次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python读写json文件的简单实现
Apr 11 Python
Python HTTP客户端自定义Cookie实现实例
Apr 28 Python
Python 多核并行计算的示例代码
Nov 07 Python
解析Python中的eval()、exec()及其相关函数
Dec 20 Python
Python+selenium实现截图图片并保存截取的图片
Jan 05 Python
Python中反射和描述器总结
Sep 23 Python
如何基于python实现画不同品种的樱花树
Jan 03 Python
keras多显卡训练方式
Jun 10 Python
keras做CNN的训练误差loss的下降操作
Jun 22 Python
python如何爬取动态网站
Sep 09 Python
关于django python manage.py startapp 应用名出错异常原因解析
Dec 15 Python
pandas数值排序的实现实例
Jul 25 Python
python GUI库图形界面开发之PyQt5打开保存对话框QFileDialog详细使用方法与实例
Feb 27 #Python
python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例
Feb 27 #Python
python GUI库图形界面开发之PyQt5单行文本框控件QLineEdit详细使用方法与实例
Feb 27 #Python
Python如何使用OS模块调用cmd
Feb 27 #Python
python之生成多层json结构的实现
Feb 27 #Python
Python查找不限层级Json数据中某个key或者value的路径方式
Feb 27 #Python
python GUI库图形界面开发之PyQt5窗口布局控件QStackedWidget详细使用方法
Feb 27 #Python
You might like
ThinkPHP有变量的where条件分页实例
2014/11/03 PHP
php中关于长度计算容易混淆的问题分析
2016/05/27 PHP
THINKPHP截取中文字符串函数实例代码
2017/03/20 PHP
PHP 传输会话curl函数的实例详解
2017/09/12 PHP
javascript 选择文件夹对话框(web)
2009/07/07 Javascript
JS正则表达式验证数字代码
2014/01/28 Javascript
javascript不同类型数据之间的运算的转换方法
2014/02/13 Javascript
JavaScript实现的购物车效果可以运用在好多地方
2014/05/09 Javascript
jQuery实现鼠标可拖动调整表格列宽度
2014/05/26 Javascript
javascript将数字转换整数金额大写的方法
2015/01/27 Javascript
select下拉框插件jquery.editable-select详解
2017/01/22 Javascript
JavaScript 过滤关键字
2017/03/20 Javascript
Extjs 中的 Treepanel 实现菜单级联选中效果及实例代码
2017/08/22 Javascript
vue与TypeScript集成配置最简教程(推荐)
2017/10/17 Javascript
使用Vue-cli 3.0搭建Vue项目的方法
2018/06/07 Javascript
Vue源码解读之Component组件注册的实现
2018/08/24 Javascript
vue下拉菜单组件(含搜索)的实现代码
2018/11/25 Javascript
vue中组件的3种使用方式详解
2019/03/23 Javascript
原生JS使用Canvas实现拖拽式绘图功能
2019/06/05 Javascript
在vue中使用eslint,配合vscode的操作
2020/11/09 Javascript
[04:26]2014DOTA2国际邀请赛-Newbee顺利进入胜者组决赛 独家专访战神7
2014/07/19 DOTA
零基础写python爬虫之爬虫的定义及URL构成
2014/11/04 Python
python实战串口助手_解决8串口多个发送的问题
2019/06/12 Python
python实现图片压缩代码实例
2019/08/12 Python
Python PO设计模式的具体使用
2019/08/16 Python
详解Django配置优化方法
2019/11/18 Python
pytorch加载自定义网络权重的实现
2020/01/07 Python
Python数组并集交集补集代码实例
2020/02/18 Python
输入N,打印N*N矩阵
2012/02/20 面试题
计算机专业毕业生求职信分享
2013/12/24 职场文书
学习心得体会
2014/01/01 职场文书
幼儿园园长新年寄语2015
2014/12/08 职场文书
锅炉工岗位职责
2015/02/13 职场文书
获奖感言怎么写
2015/07/31 职场文书
2016年小学端午节活动总结
2016/04/01 职场文书
只用40行Python代码就能写出pdf转word小工具
2021/05/31 Python