python统计文章中单词出现次数实例


Posted in Python onFebruary 27, 2020

python统计单词出现次数

做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。

下面是具体的实现代码,实现了从importthis.txt文件读取单词,并统计出现次数最多的5个单词。

# -*- coding:utf-8 -*-
import io
import re
 
class Counter:
  def __init__(self, path):
    """
    :param path: 文件路径
    """
    self.mapping = dict()
    with io.open(path, encoding="utf-8") as f:
      data = f.read()
      words = [s.lower() for s in re.findall("\w+", data)]
      for word in words:
        self.mapping[word] = self.mapping.get(word, 0) + 1
 
  def most_common(self, n):
    assert n > 0, "n should be large than 0"
    return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]
 
if __name__ == '__main__':
  most_common_5 = Counter("importthis.txt").most_common(5)
  for item in most_common_5:
    print(item)

执行效果:

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

知识点补充

1、如何正确读写文件

2、如何对数据进行排序

3、字典数据类型的运用

4、正则表达式的运用

到此这篇关于python统计文章中单词出现次数实例的文章就介绍到这了,更多相关python统计单词出现次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python写入中英文字符串到文件的方法
May 06 Python
Python实现打印螺旋矩阵功能的方法
Nov 21 Python
python 实现语音聊天机器人的示例代码
Dec 02 Python
Python range、enumerate和zip函数用法详解
Sep 11 Python
Python 进程操作之进程间通过队列共享数据,队列Queue简单示例
Oct 11 Python
Pytorch实现的手写数字mnist识别功能完整示例
Dec 13 Python
python 利用已有Ner模型进行数据清洗合并代码
Dec 24 Python
python3.8与pyinstaller冲突问题的快速解决方法
Jan 16 Python
Python3运算符常见用法分析
Feb 14 Python
python 带时区的日期格式化操作
Oct 23 Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 Python
PyCharm 解决找不到新打开项目的窗口问题
Jan 15 Python
python GUI库图形界面开发之PyQt5打开保存对话框QFileDialog详细使用方法与实例
Feb 27 #Python
python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例
Feb 27 #Python
python GUI库图形界面开发之PyQt5单行文本框控件QLineEdit详细使用方法与实例
Feb 27 #Python
Python如何使用OS模块调用cmd
Feb 27 #Python
python之生成多层json结构的实现
Feb 27 #Python
Python查找不限层级Json数据中某个key或者value的路径方式
Feb 27 #Python
python GUI库图形界面开发之PyQt5窗口布局控件QStackedWidget详细使用方法
Feb 27 #Python
You might like
自动分页的不完整解决方案
2007/01/12 PHP
php微信支付之APP支付方法
2015/03/04 PHP
PHP获取文件夹大小函数用法实例
2015/07/01 PHP
jQuery页面加载初始化常用的三种方法
2014/06/04 Javascript
SeaJS 与 RequireJS 的差异对比
2014/12/08 Javascript
js实现缓冲运动效果的方法
2015/04/10 Javascript
JQuery CheckBox(复选框)操作方法汇总
2015/04/15 Javascript
原生js实现百叶窗效果及原理介绍
2016/04/12 Javascript
Javascript中字符串replace方法的第二个参数探究
2016/12/05 Javascript
使用BootStrap实现悬浮窗口的效果
2016/12/13 Javascript
原生js获取浏览器窗口及元素宽高常用方法集合
2017/01/18 Javascript
js获取元素的偏移量offset简单方法(必看)
2017/07/05 Javascript
小程序实现发表评论功能
2018/07/06 Javascript
微信小程序-form表单提交代码实例
2019/04/29 Javascript
jQuery模仿ToDoList实现简单的待办事项列表
2019/12/30 jQuery
浅析 Vue 3.0 的组装式 API(一)
2020/08/31 Javascript
python列表去重的二种方法
2014/02/14 Python
python编写网页爬虫脚本并实现APScheduler调度
2014/07/28 Python
Python中的一些陷阱与技巧小结
2015/07/10 Python
利用Python脚本实现ping百度和google的方法
2017/01/24 Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
2019/04/09 Python
Python3.5模块的定义、导入、优化操作图文详解
2019/04/27 Python
PyTorch的Optimizer训练工具的实现
2019/08/18 Python
Python交互环境下打印和输入函数的实例内容
2020/02/16 Python
基于Python制作一副扑克牌过程详解
2020/10/19 Python
python 读取yaml文件的两种方法(在unittest中使用)
2020/12/01 Python
python在协程中增加任务实例操作
2021/02/28 Python
美国汽车轮胎和轮毂销售网站:Tire Rack
2018/01/11 全球购物
一级方程式赛车官方网上商店:F1 Store(支持中文)
2018/01/12 全球购物
Quiksilver美国官网:始于1969年的优质冲浪服和滑雪板外套
2020/04/20 全球购物
历史学专业大学生找工作的自我评价
2013/10/16 职场文书
入党思想汇报
2014/01/05 职场文书
公司年会晚宴演讲稿
2014/01/06 职场文书
作风整顿个人剖析材料
2014/10/06 职场文书
校园安全学习心得体会
2016/01/18 职场文书
2016优秀毕业生个人事迹材料
2016/02/29 职场文书