Python实现统计文本文件字数的方法


Posted in Python onMay 05, 2017

本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考,具体如下:

统计文本文件的字数,从当前目录下的file.txt取文件

# -*- coding: GBK -*-
import string
import sys
reload(sys)
def compareItems((w1,c1), (w2,c2)):
  if c1 > c2:
    return - 1
  elif c1 == c2:
    return cmp(w1, w2)
  else:
    return 1
def main():
  fname = "file.txt"
  try:
    text = open(fname,'r').read()
    text = string.lower(text)
  except:
    print "\nfile.txt is not exist!!! or There is a R/W error! "
    sys.exit()
  for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':
    text = string.replace(text, ch, ' ')
  words = string.split(text)
  counts = {}
  for w in words:
    counts[w] = counts.get(w,0) + 1
  n = input("\n输入要统计的top单词数:")
  items = counts.items()
  items.sort(compareItems)
  max = len(items)
  print "\n单词总计:" + str(len(words))
  print "单词净个数(已去重):" + str(max)
  print "\n"
  if n > max:
    n = max
  for i in range(n):
    print "%-10s%5d" % items[i]
if __name__ == '__main__':
  main()
Python 相关文章推荐
python正则表达式re模块详细介绍
May 29 Python
Python实现导出数据生成excel报表的方法示例
Jul 12 Python
Pandas 数据处理,数据清洗详解
Jul 10 Python
python3基于TCP实现CS架构文件传输
Jul 28 Python
Python遍历文件夹 处理json文件的方法
Jan 22 Python
Python学习笔记基本数据结构之序列类型list tuple range用法分析
Jun 08 Python
使用python获取(宜宾市地震信息)地震信息
Jun 20 Python
django 微信网页授权登陆的实现
Jul 30 Python
Python itertools.product方法代码实例
Mar 27 Python
Python OpenCV去除字母后面的杂线操作
Jul 05 Python
基于python实现判断字符串是否数字算法
Jul 10 Python
Python通过len函数返回对象长度
Oct 22 Python
Python部署web开发程序的几种方法
May 05 #Python
Python中异常重试的解决方案详解
May 05 #Python
Django的信号机制详解
May 05 #Python
Python中模块与包有相同名字的处理方法
May 05 #Python
详解python 字符串和日期之间转换 StringAndDate
May 04 #Python
Pycharm学习教程(7)虚拟机VM的配置教程
May 04 #Python
python 统计代码行数简单实例
May 04 #Python
You might like
PHP 简单日历实现代码
2009/10/28 PHP
PHP不用第三变量交换2个变量的值的解决方法
2013/06/02 PHP
php中文繁体和简体相互转换的方法
2015/03/21 PHP
javascript如何使用bind指定接收者
2014/05/04 Javascript
用JavaScript实现一个代码简洁、逻辑不复杂的多级树
2014/05/23 Javascript
JS实现简单的顶部定时关闭层效果
2014/06/15 Javascript
Javascript学习笔记之 函数篇(二) : this 的工作机制
2014/06/24 Javascript
javascript同步服务器时间和同步倒计时小技巧
2015/09/24 Javascript
js代码延迟一定时间后执行一个函数的实例
2017/02/15 Javascript
JS查找英文文章中出现频率最高的单词
2017/03/20 Javascript
解决vue v-for 遍历循环时key值报错的问题
2018/09/06 Javascript
vue 实现购物车总价计算
2019/11/06 Javascript
vue学习之Vue-Router用法实例分析
2020/01/06 Javascript
javascript实现获取中文汉字拼音首字母
2020/05/19 Javascript
webpack+vue-cil 中proxyTable配置接口地址代理操作
2020/07/18 Javascript
实现vuex原理的示例
2020/10/21 Javascript
Python挑选文件夹里宽大于300图片的方法
2015/03/05 Python
python从网络读取图片并直接进行处理的方法
2015/05/22 Python
Python爬虫_城市公交、地铁站点和线路数据采集实例
2018/01/10 Python
浅谈Python对内存的使用(深浅拷贝)
2018/01/17 Python
Python Numpy 数组的初始化和基本操作
2018/03/13 Python
python修改txt文件中的某一项方法
2018/12/29 Python
Pycharm之快速定位到某行快捷键的方法
2019/01/20 Python
python爬取百度贴吧前1000页内容(requests库面向对象思想实现)
2019/08/10 Python
Python基础进阶之海量表情包多线程爬虫功能的实现
2020/12/17 Python
使用Django的JsonResponse返回数据的实现
2021/01/15 Python
HTML5地理定位与第三方工具百度地图的应用
2016/11/17 HTML / CSS
经典c++面试题六
2012/01/18 面试题
党员党性分析材料
2014/02/17 职场文书
法人代表授权委托书
2014/04/08 职场文书
校长师德表现自我评价
2015/03/04 职场文书
培训通知
2015/04/17 职场文书
2016年小学教师政治学习心得体会
2016/01/23 职场文书
nginx处理http请求实现过程解析
2021/03/31 Servers
mysql定时自动备份数据库的方法步骤
2021/07/07 MySQL
PostgreSQL出现死锁该如何解决
2022/05/30 PostgreSQL