python统计文本文件内单词数量的方法


Posted in Python onMay 30, 2015

本文实例讲述了python统计文本文件内单词数量的方法。分享给大家供大家参考。具体实现方法如下:

# count lines, sentences, and words of a text file
# set all the counters to zero
lines, blanklines, sentences, words = 0, 0, 0, 0
print '-' * 50
try:
 # use a text file you have, or google for this one ...
 filename = 'GettysburgAddress.txt'
 textf = open(filename, 'r')
except IOError:
 print 'Cannot open file %s for reading' % filename
 import sys
 sys.exit(0)
# reads one line at a time
for line in textf:
 print line,  # test
 lines += 1
 if line.startswith('\n'):
  blanklines += 1
 else:
  # assume that each sentence ends with . or ! or ?
  # so simply count these characters
  sentences += line.count('.') + line.count('!') + line.count('?')
  # create a list of words
  # use None to split at any whitespace regardless of length
  # so for instance double space counts as one space
  tempwords = line.split(None)
  print tempwords # test
  # word total count
  words += len(tempwords)
textf.close()
print '-' * 50
print "Lines   : ", lines
print "Blank lines: ", blanklines
print "Sentences : ", sentences
print "Words   : ", words
# optional console wait for keypress
from msvcrt import getch
getch()

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
python3实现TCP协议的简单服务器和客户端案例(分享)
Jun 14 Python
Python实现查询某个目录下修改时间最新的文件示例
Aug 29 Python
Python简单I/O操作示例
Mar 18 Python
在pyqt5中QLineEdit里面的内容回车发送的实例
Jun 21 Python
Django框架orM与自定义SQL语句混合事务控制操作
Jun 27 Python
python支付宝支付示例详解
Aug 22 Python
Python序列化与反序列化pickle用法实例
Nov 11 Python
Python代码生成视频的缩略图的实例讲解
Dec 22 Python
Django表单提交后实现获取相同name的不同value值
May 14 Python
初学者学习Python好还是Java好
May 26 Python
keras中的History对象用法
Jun 19 Python
Python3基于print打印带颜色字符串
Jul 06 Python
python使用win32com库播放mp3文件的方法
May 30 #Python
基于wxpython开发的简单gui计算器实例
May 30 #Python
python图像处理之镜像实现方法
May 30 #Python
python图像处理之反色实现方法
May 30 #Python
python中字典(Dictionary)用法实例详解
May 30 #Python
python集合用法实例分析
May 30 #Python
基于wxpython实现的windows GUI程序实例
May 30 #Python
You might like
PHP防注入安全代码
2008/04/09 PHP
php cli 方式 在crotab中运行解决
2010/02/08 PHP
PHP OPCode缓存 APC详细介绍
2010/10/12 PHP
php stream_get_meta_data返回值
2013/09/29 PHP
destoon整合UCenter图文教程
2014/06/21 PHP
ThinkPHP查询返回简单字段数组的方法
2014/08/25 PHP
《JavaScript高级程序设计》阅读笔记(三) ECMAScript中的引用类型
2012/02/27 Javascript
浅谈Javascript鼠标和滚轮事件
2012/06/27 Javascript
Highcharts 非常实用的Javascript统计图demo示例
2013/07/03 Javascript
Java File类的常用方法总结
2015/03/18 Javascript
JS实现很实用的对联广告代码(可自适应高度)
2015/09/18 Javascript
JS获取当前使用的浏览器名字以及版本号实现方法
2016/08/19 Javascript
JavaScript实现三级联动效果
2017/07/15 Javascript
你应该知道的几类npm依赖包管理详解
2017/10/06 Javascript
使用puppeteer破解极验的滑动验证码
2018/02/24 Javascript
jQuery实现的上传图片本地预览效果简单示例
2018/03/29 jQuery
浅谈vue同一页面中拥有两个表单时,的验证问题
2018/09/18 Javascript
微信上传视频文件提示(推荐)
2018/11/22 Javascript
Vue组件模板的几种书写形式(3种)
2020/02/19 Javascript
vue2路由基本用法实例分析
2020/03/06 Javascript
跟老齐学Python之不要红头文件(2)
2014/09/28 Python
使用Python的urllib和urllib2模块制作爬虫的实例教程
2016/01/20 Python
详解django的serializer序列化model几种方法
2018/10/16 Python
Django框架配置mysql数据库实现过程
2020/04/22 Python
Pandas对每个分组应用apply函数的实现
2020/12/13 Python
Python如何实现感知器的逻辑电路
2020/12/25 Python
css3一个简易的 LED 数字时钟实现方法
2020/01/15 HTML / CSS
JBL澳大利亚官方商店:扬声器、耳机和音响系统
2018/05/24 全球购物
女性时尚网购:Chic Me
2019/07/30 全球购物
竞争上岗演讲稿
2014/01/05 职场文书
化工专业自荐书
2014/06/16 职场文书
入党积极分子自我批评思想汇报
2014/10/10 职场文书
群众路线教育实践活动心得体会(教师)
2014/10/31 职场文书
初中家长意见
2015/06/03 职场文书
植树节新闻稿
2015/07/17 职场文书
HTML基础-标签分类(闭合标签,空标签,块级元素,行内元素,行级块元素,可替换元素)
2021/03/31 HTML / CSS