python统计文本文件内单词数量的方法


Posted in Python onMay 30, 2015

本文实例讲述了python统计文本文件内单词数量的方法。分享给大家供大家参考。具体实现方法如下:

# count lines, sentences, and words of a text file
# set all the counters to zero
lines, blanklines, sentences, words = 0, 0, 0, 0
print '-' * 50
try:
 # use a text file you have, or google for this one ...
 filename = 'GettysburgAddress.txt'
 textf = open(filename, 'r')
except IOError:
 print 'Cannot open file %s for reading' % filename
 import sys
 sys.exit(0)
# reads one line at a time
for line in textf:
 print line,  # test
 lines += 1
 if line.startswith('\n'):
  blanklines += 1
 else:
  # assume that each sentence ends with . or ! or ?
  # so simply count these characters
  sentences += line.count('.') + line.count('!') + line.count('?')
  # create a list of words
  # use None to split at any whitespace regardless of length
  # so for instance double space counts as one space
  tempwords = line.split(None)
  print tempwords # test
  # word total count
  words += len(tempwords)
textf.close()
print '-' * 50
print "Lines   : ", lines
print "Blank lines: ", blanklines
print "Sentences : ", sentences
print "Words   : ", words
# optional console wait for keypress
from msvcrt import getch
getch()

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
详解Python文本操作相关模块
Jun 22 Python
Python使用pip安装报错:is not a supported wheel on this platform的解决方法
Jan 23 Python
Python3 关于pycharm自动导入包快捷设置的方法
Jan 16 Python
利用python实现对web服务器的目录探测的方法
Feb 26 Python
Python高级特性与几种函数的讲解
Mar 08 Python
python3.6生成器yield用法实例分析
Aug 23 Python
解决pytorch-yolov3 train 报错的问题
Feb 18 Python
Python退出时强制运行一段代码的实现方法
Apr 29 Python
Python-jenkins 获取job构建信息方式
May 12 Python
Python3读取和写入excel表格数据的示例代码
Jun 09 Python
python 删除系统中的文件(按时间,大小,扩展名)
Nov 19 Python
如何用python识别滑块验证码中的缺口
Apr 01 Python
python使用win32com库播放mp3文件的方法
May 30 #Python
基于wxpython开发的简单gui计算器实例
May 30 #Python
python图像处理之镜像实现方法
May 30 #Python
python图像处理之反色实现方法
May 30 #Python
python中字典(Dictionary)用法实例详解
May 30 #Python
python集合用法实例分析
May 30 #Python
基于wxpython实现的windows GUI程序实例
May 30 #Python
You might like
jquery 获取自定义属性(attr和prop)的实现代码
2012/06/27 Javascript
jQuery实现简单网页遮罩层/弹出层效果兼容IE6、IE7
2014/06/16 Javascript
JavaScript判断数组是否包含指定元素的方法
2015/07/01 Javascript
swtich/if...else的替代语句
2015/08/16 Javascript
详解JavaScript编程中的数组结构
2015/10/24 Javascript
jQuery无刷新分页完整实例代码
2015/10/27 Javascript
使用AJAX实现Web页面进度条的实例分享
2016/05/06 Javascript
遍历json 对象的属性并且动态添加属性的实现
2016/12/02 Javascript
探索Javascript中this的奥秘
2016/12/11 Javascript
bootstrap table实现单击单元格可编辑功能
2017/03/28 Javascript
微信小程序云开发之模拟后台增删改查
2019/05/16 Javascript
jQuery内容选择器与表单选择器实例分析
2019/06/28 jQuery
解决layui动态加载复选框无法选中的问题
2019/09/20 Javascript
在LayUI图片上传中,解决由跨域问题引起的请求接口错误的方法
2019/09/24 Javascript
D3.js 实现带伸缩时间轴拓扑图的示例代码
2020/01/20 Javascript
ES11新增的这9个新特性,你都掌握了吗
2020/10/15 Javascript
[05:59]带你看看DPC的台前幕后
2021/03/11 DOTA
python实现基本进制转换的方法
2015/07/11 Python
python基础教程之五种数据类型详解
2017/01/12 Python
使用Python读取安卓手机的屏幕分辨率方法
2018/03/31 Python
Python分支语句与循环语句应用实例分析
2019/05/07 Python
使用pickle存储数据dump 和 load实例讲解
2019/12/30 Python
pytorch三层全连接层实现手写字母识别方式
2020/01/14 Python
用什么库写 Python 命令行程序(示例代码详解)
2020/02/20 Python
新手常见Python错误及异常解决处理方案
2020/06/18 Python
python和c语言哪个更适合初学者
2020/06/22 Python
CSS3之多背景background使用示例
2013/10/18 HTML / CSS
荷兰的时尚市场:To Be Dressed
2019/05/06 全球购物
生日主持词
2014/03/20 职场文书
学雷锋演讲稿汇总
2014/05/10 职场文书
信用卡工资证明范本
2014/10/17 职场文书
2016学校先进党组织事迹材料
2016/02/29 职场文书
青年岗位能手事迹材料(2016推荐版)
2016/03/01 职场文书
解除合同协议书范本
2016/03/21 职场文书
深入解析Apache Hudi内核文件标记机制
2022/03/31 Servers
HTML 里 img 元素的 src 和 srcset 属性的区别详解
2023/05/21 HTML / CSS