python统计文章中单词出现次数实例


Posted in Python onFebruary 27, 2020

python统计单词出现次数

做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。

下面是具体的实现代码,实现了从importthis.txt文件读取单词,并统计出现次数最多的5个单词。

# -*- coding:utf-8 -*-
import io
import re
 
class Counter:
  def __init__(self, path):
    """
    :param path: 文件路径
    """
    self.mapping = dict()
    with io.open(path, encoding="utf-8") as f:
      data = f.read()
      words = [s.lower() for s in re.findall("\w+", data)]
      for word in words:
        self.mapping[word] = self.mapping.get(word, 0) + 1
 
  def most_common(self, n):
    assert n > 0, "n should be large than 0"
    return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]
 
if __name__ == '__main__':
  most_common_5 = Counter("importthis.txt").most_common(5)
  for item in most_common_5:
    print(item)

执行效果:

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

知识点补充

1、如何正确读写文件

2、如何对数据进行排序

3、字典数据类型的运用

4、正则表达式的运用

到此这篇关于python统计文章中单词出现次数实例的文章就介绍到这了,更多相关python统计单词出现次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python strip lstrip rstrip使用方法
Sep 06 Python
高性能web服务器框架Tornado简单实现restful接口及开发实例
Jul 16 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 Python
Python处理Excel文件实例代码
Jun 20 Python
不同版本中Python matplotlib.pyplot.draw()界面绘制异常问题的解决
Sep 24 Python
python3.x实现发送邮件功能
May 22 Python
NumPy.npy与pandas DataFrame的实例讲解
Jul 09 Python
python高斯分布概率密度函数的使用详解
Jul 10 Python
使用Python制作缩放自如的圣诞老人(圣诞树)
Dec 25 Python
python3实现往mysql中插入datetime类型的数据
Mar 02 Python
Python 实现键盘鼠标按键模拟
Nov 18 Python
Python中time与datetime模块使用方法详解
Mar 31 Python
python GUI库图形界面开发之PyQt5打开保存对话框QFileDialog详细使用方法与实例
Feb 27 #Python
python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例
Feb 27 #Python
python GUI库图形界面开发之PyQt5单行文本框控件QLineEdit详细使用方法与实例
Feb 27 #Python
Python如何使用OS模块调用cmd
Feb 27 #Python
python之生成多层json结构的实现
Feb 27 #Python
Python查找不限层级Json数据中某个key或者value的路径方式
Feb 27 #Python
python GUI库图形界面开发之PyQt5窗口布局控件QStackedWidget详细使用方法
Feb 27 #Python
You might like
php分页思路以及在ZF中的使用
2012/05/30 PHP
php中使用redis队列操作实例代码
2013/02/07 PHP
PHP动态页生成静态页的3种常用方法
2014/11/13 PHP
php、mysql查询当天,查询本周,查询本月的数据实例(字段是时间戳)
2017/02/04 PHP
PHP使用gearman进行异步的邮件或短信发送操作详解
2020/02/27 PHP
学习ExtJS 访问容器对象
2009/10/07 Javascript
js 获取Listbox选择的值的代码
2010/04/15 Javascript
jQuery 动画弹出窗体支持多种展现方式
2010/04/29 Javascript
用jQuery打造TabPanel效果代码
2010/05/22 Javascript
10款非常有用的 Ajax 插件分享
2012/03/14 Javascript
js或者jquery判断图片是否加载完成实现代码
2013/03/20 Javascript
js实现图片从左往右渐变切换效果的方法
2015/02/06 Javascript
JS实现点击文字对应DIV层不停闪动效果的方法
2015/03/02 Javascript
jQuery头像裁剪工具jcrop用法实例(附演示与demo源码下载)
2016/01/22 Javascript
jquery之别踩白块游戏的简单实现
2016/07/25 Javascript
JS中的三个循环小结
2017/06/20 Javascript
基于AngularJS实现表单验证功能
2017/07/28 Javascript
Pycharm学习教程(5) Python快捷键相关设置
2017/05/03 Python
使用Python进行目录的对比方法
2018/11/01 Python
在python中创建指定大小的多维数组方式
2019/11/28 Python
Python之关于类变量的两种赋值区别详解
2020/03/12 Python
Tensorflow中的dropout的使用方法
2020/03/13 Python
详解Python利用configparser对配置文件进行读写操作
2020/11/03 Python
基于CSS3实现的漂亮Menu菜单效果代码
2015/09/10 HTML / CSS
CSS3贝塞尔曲线示例:创建链接悬停动画效果
2020/11/19 HTML / CSS
大学生的应聘自我评价
2013/12/13 职场文书
运动会广播稿200字
2014/01/15 职场文书
三查三看党性分析材料
2014/02/18 职场文书
机电一体化求职信
2014/03/10 职场文书
党的群众路线查摆剖析材料
2014/10/10 职场文书
大学生实习推荐信
2015/03/27 职场文书
老干部座谈会主持词
2015/07/03 职场文书
安全温馨提示语大全
2015/07/14 职场文书
Django开发RESTful API实现增删改查(入门级)
2021/05/10 Python
Javascript设计模式之原型模式详细
2021/10/05 Javascript
一篇文章弄清楚Ajax请求的五个步骤
2022/03/17 Javascript