Python实现统计文本文件字数的方法


Posted in Python onMay 05, 2017

本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考,具体如下:

统计文本文件的字数,从当前目录下的file.txt取文件

# -*- coding: GBK -*-
import string
import sys
reload(sys)
def compareItems((w1,c1), (w2,c2)):
  if c1 > c2:
    return - 1
  elif c1 == c2:
    return cmp(w1, w2)
  else:
    return 1
def main():
  fname = "file.txt"
  try:
    text = open(fname,'r').read()
    text = string.lower(text)
  except:
    print "\nfile.txt is not exist!!! or There is a R/W error! "
    sys.exit()
  for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':
    text = string.replace(text, ch, ' ')
  words = string.split(text)
  counts = {}
  for w in words:
    counts[w] = counts.get(w,0) + 1
  n = input("\n输入要统计的top单词数:")
  items = counts.items()
  items.sort(compareItems)
  max = len(items)
  print "\n单词总计:" + str(len(words))
  print "单词净个数(已去重):" + str(max)
  print "\n"
  if n > max:
    n = max
  for i in range(n):
    print "%-10s%5d" % items[i]
if __name__ == '__main__':
  main()
Python 相关文章推荐
Python列表推导式的使用方法
Nov 21 Python
python使用7z解压apk包的方法
Apr 18 Python
Python发送email的3种方法
Apr 28 Python
安装python3的时候就是输入python3死活没有反应的解决方法
Jan 24 Python
对python requests的content和text方法的区别详解
Oct 11 Python
python计算两个矩形框重合百分比的实例
Nov 07 Python
对Python信号处理模块signal详解
Jan 09 Python
Django中自定义admin Xadmin的实现代码
Aug 09 Python
python爬虫 2019中国好声音评论爬取过程解析
Aug 26 Python
在python3中使用shuffle函数要注意的地方
Feb 28 Python
通过代码实例了解Python sys模块
Sep 14 Python
python 爬虫请求模块requests详解
Dec 04 Python
Python部署web开发程序的几种方法
May 05 #Python
Python中异常重试的解决方案详解
May 05 #Python
Django的信号机制详解
May 05 #Python
Python中模块与包有相同名字的处理方法
May 05 #Python
详解python 字符串和日期之间转换 StringAndDate
May 04 #Python
Pycharm学习教程(7)虚拟机VM的配置教程
May 04 #Python
python 统计代码行数简单实例
May 04 #Python
You might like
ThinkPHP标签制作教程
2014/07/10 PHP
php递归创建目录的方法
2015/02/02 PHP
Laravel框架集成UEditor编辑器的方法图文与实例详解
2019/04/17 PHP
Alliance vs Liquid BO3 第一场2.13
2021/03/10 DOTA
Node.js 异步编程之 Callback介绍(一)
2015/03/30 Javascript
JQuery复制DOM节点的方法
2015/06/11 Javascript
js添加绑定事件的方法
2016/05/15 Javascript
Node.js中看JavaScript的引用
2017/04/22 Javascript
详谈JS中数组的迭代方法和归并方法
2017/08/11 Javascript
基于Vue实例生命周期(全面解析)
2017/08/16 Javascript
详解使用PM2管理nodejs进程
2017/10/24 NodeJs
vue在自定义组件中使用v-model进行数据绑定的方法
2019/03/25 Javascript
关于vue-cli 3配置打包优化要点(推荐)
2019/04/22 Javascript
JS获取本地地址及天气的方法实例小结
2019/05/10 Javascript
redux处理异步action解决方案
2020/03/22 Javascript
[02:39]DOTA2英雄基础教程 极限穿梭编织者
2013/12/05 DOTA
[52:20]VP vs VG Supermajor小组赛 B组胜者组决赛 BO3 第一场 6.2
2018/06/03 DOTA
Python isinstance判断对象类型
2008/09/06 Python
python读取excel表格生成erlang数据
2017/08/26 Python
使用pandas批量处理矢量化字符串的实例讲解
2018/07/10 Python
Pycharm连接远程服务器并实现远程调试的实现
2019/08/02 Python
python Pexpect模块的使用
2020/12/25 Python
基于css3 animate制作绚丽的动画效果
2015/11/24 HTML / CSS
5个你不知道的HTML5的接口介绍
2013/08/07 HTML / CSS
Get The Label中文官网:英国运动时尚购物平台
2017/04/19 全球购物
酒店经理职责
2014/01/30 职场文书
优秀团支部事迹材料
2014/02/08 职场文书
综合内勤岗位职责
2014/04/14 职场文书
考博专家推荐信
2014/05/10 职场文书
汽车广告策划方案
2014/05/31 职场文书
财会专业大学生求职信
2014/09/26 职场文书
新年祝酒词大全
2015/08/11 职场文书
my.ini优化mysql数据库性能的十个参数(推荐)
2021/05/26 MySQL
Python数据分析之绘图和可视化详解
2021/06/02 Python
MySQL 数据表操作
2022/05/04 MySQL
JS前端轻量fabric.js系列物体基类
2022/08/05 Javascript