python统计文本文件内单词数量的方法


Posted in Python onMay 30, 2015

本文实例讲述了python统计文本文件内单词数量的方法。分享给大家供大家参考。具体实现方法如下:

# count lines, sentences, and words of a text file
# set all the counters to zero
lines, blanklines, sentences, words = 0, 0, 0, 0
print '-' * 50
try:
 # use a text file you have, or google for this one ...
 filename = 'GettysburgAddress.txt'
 textf = open(filename, 'r')
except IOError:
 print 'Cannot open file %s for reading' % filename
 import sys
 sys.exit(0)
# reads one line at a time
for line in textf:
 print line,  # test
 lines += 1
 if line.startswith('\n'):
  blanklines += 1
 else:
  # assume that each sentence ends with . or ! or ?
  # so simply count these characters
  sentences += line.count('.') + line.count('!') + line.count('?')
  # create a list of words
  # use None to split at any whitespace regardless of length
  # so for instance double space counts as one space
  tempwords = line.split(None)
  print tempwords # test
  # word total count
  words += len(tempwords)
textf.close()
print '-' * 50
print "Lines   : ", lines
print "Blank lines: ", blanklines
print "Sentences : ", sentences
print "Words   : ", words
# optional console wait for keypress
from msvcrt import getch
getch()

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
python爬虫headers设置后无效的解决方法
Oct 21 Python
PyCharm 常用快捷键和设置方法
Dec 20 Python
python 格式化输出百分号的方法
Jan 20 Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 Python
Flask配置Cors跨域的实现
Jul 12 Python
python的常见矩阵运算(小结)
Aug 07 Python
Python数据持久化存储实现方法分析
Dec 21 Python
python爬虫库scrapy简单使用实例详解
Feb 10 Python
Python如何把十进制数转换成ip地址
May 25 Python
python 解决selenium 中的 .clear()方法失效问题
Sep 01 Python
python eventlet绿化和patch原理
Nov 21 Python
python3使用diagrams绘制架构图的步骤
Apr 08 Python
python使用win32com库播放mp3文件的方法
May 30 #Python
基于wxpython开发的简单gui计算器实例
May 30 #Python
python图像处理之镜像实现方法
May 30 #Python
python图像处理之反色实现方法
May 30 #Python
python中字典(Dictionary)用法实例详解
May 30 #Python
python集合用法实例分析
May 30 #Python
基于wxpython实现的windows GUI程序实例
May 30 #Python
You might like
phpStudy配置多站点多域名和多端口的方法
2017/09/01 PHP
PHP发送邮件确认验证注册功能示例【修改别人邮件类】
2019/11/09 PHP
php使用pthreads v3多线程实现抓取新浪新闻信息操作示例
2020/02/21 PHP
JQuery循环滚动图片代码
2011/12/08 Javascript
Jquery命名冲突解决的五种方案分享
2012/03/16 Javascript
javascript事件冒泡详解和捕获、阻止方法
2014/04/12 Javascript
JS辨别访问浏览器判断是android还是ios系统
2014/08/19 Javascript
Javascript中Array.prototype.map()详解
2014/10/22 Javascript
JavaScript获取文本框内选中文本的方法
2015/02/20 Javascript
JS根据key值获取URL中的参数值及把URL的参数转换成json对象
2015/08/26 Javascript
javascript动画之磁性吸附效果篇
2016/12/09 Javascript
Bootstrap面板学习使用
2017/02/09 Javascript
js 调用百度分享功能
2017/02/27 Javascript
微信小程序中input标签详解及简单实例
2017/05/18 Javascript
JS中的事件委托实例浅析
2018/03/22 Javascript
JavaScript如何对图片进行黑白化
2018/04/10 Javascript
微信小程序云开发使用方法新手初体验
2019/05/16 Javascript
利用Python的Flask框架来构建一个简单的数字商品支付解决方案
2015/03/31 Python
Django在win10下的安装并创建工程
2017/11/20 Python
Random 在 Python 中的使用方法
2018/08/09 Python
python解析yaml文件过程详解
2019/08/30 Python
pandas实现将日期转换成timestamp
2019/12/07 Python
关于python中的xpath解析定位
2020/03/06 Python
python实现飞船游戏的纵向移动
2020/04/24 Python
马来西亚最热门的在线时尚商店:FashionValet
2018/11/11 全球购物
使用C#编写创建一个线程的代码
2013/01/22 面试题
个人简历自我评价范文
2014/02/04 职场文书
地质工程专业毕业生求职信
2014/08/08 职场文书
自动化专业大学生职业生涯规划范文:爱拚才会赢
2014/09/12 职场文书
个人四风问题对照检查材料
2014/10/01 职场文书
公司门卫岗位职责
2015/04/13 职场文书
公务员爱岗敬业心得体会
2016/01/25 职场文书
该怎么书写道歉信?
2019/07/03 职场文书
那些美到让人窒息的诗句,值得你收藏!
2019/08/20 职场文书
Python中requests做接口测试的方法
2021/05/30 Python
golang特有程序结构入门教程
2021/06/02 Python