Python实现统计单词出现的个数


Posted in Python onMay 28, 2015

最近在看python脚本语言,脚本语言是一种解释性的语言,不需要编译,可以直接用,由解释器来负责解释。python语言很强大,而且写起来很简洁。下面的一个例子就是用python统计单词出现的个数。

import sys
import string
#import collections

if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}:
 print("usage: uniqueword filename_1 filename_2 ... filename_n")
 sys.exit()
else:
 words = {} 
 # words = collections.defaultdict(int)
 strip = string.whitespace + string.punctuation + string.digits + "\"'"
 for filename in sys.argv[1:]:
 for line in open(filename):
  for word in line.split():
  word = word.strip(strip)
  if len(word) >= 2:
   words[word] = words.get(word, 0) + 1
   # words[word] += 1
 for word in sorted(words):
 print("'{0}' occurs {1} times".format(word,words[word]))

假设文件名是 uniqueword.py,在命令行下输入: uniqueword.py filename_1 filename_2 ... filename_n中单词出现的次数可以被统计出来。
 
第四行和第五行判断是否有输入参数,如果输入参数为空或者为-h, -help,则输出帮助信息。

从第七行到第14行是核心部分,逐一打开参数中指定的文件,并读取每一行,再用字符串的split方法把读取的行抽取出一个一个的单词,但单词长度大于2的时候,把此单词加入到字典words中。 其中words.get(word, 0)的意思是取出key等于word的value,如果key为空,则把value置为默认值0. 最后打印出结果。

Python 相关文章推荐
pycharm 使用心得(九)解决No Python interpreter selected的问题
Jun 06 Python
Python程序员开发中常犯的10个错误
Jul 07 Python
Python发送Email方法实例
Aug 21 Python
python调用机器喇叭发出蜂鸣声(Beep)的方法
Mar 23 Python
Python实现的使用telnet登陆聊天室实例
Jun 17 Python
python如何读写json数据
Mar 21 Python
Python爬虫之正则表达式的使用教程详解
Oct 25 Python
对DataFrame数据中的重复行,利用groupby累加合并的方法详解
Jan 30 Python
由Python编写的MySQL管理工具代码实例
Apr 09 Python
python将视频转换为全字符视频
Apr 26 Python
Cython编译python为so 代码加密示例
Dec 23 Python
python logging.basicConfig不生效的原因及解决
Feb 20 Python
Python下载懒人图库JavaScript特效
May 28 #Python
Python实现给qq邮箱发送邮件的方法
May 28 #Python
Python import用法以及与from...import的区别
May 28 #Python
Python中使用不同编码读写txt文件详解
May 28 #Python
Python实现统计英文单词个数及字符串分割代码
May 28 #Python
python处理大数字的方法
May 27 #Python
python类继承用法实例分析
May 27 #Python
You might like
WinXP + Apache +PHP5 + MySQL + phpMyAdmin安装全功略
2006/07/09 PHP
常用的php ADODB使用方法集锦
2008/03/25 PHP
Gregarius中文日期格式问题解决办法
2008/04/22 PHP
Drupal 添加模块出现莫名其妙的错误的解决方法(往往出现在模块较多时)
2011/04/18 PHP
深入php list()函数的详解
2013/06/05 PHP
php魔术方法功能与用法实例分析
2016/10/19 PHP
PHP设计模式之适配器模式定义与用法详解
2018/04/03 PHP
JavaScript onkeypress事件入门实例(按下或按住一个键盘按键)
2014/10/17 Javascript
js仿百度登录页实现拖动窗口效果
2016/03/11 Javascript
js中判断变量类型函数typeof的用法总结
2016/08/09 Javascript
Node.js中环境变量process.env的一些事详解
2017/10/26 Javascript
详解如何用typescript开发koa2的二三事
2018/11/13 Javascript
解决layer弹出层自适应页面大小的问题
2019/09/16 Javascript
JavaScript判断数据类型有几种方法及区别介绍
2020/09/02 Javascript
vue监听滚动事件的方法
2020/12/21 Vue.js
Python基类函数的重载与调用实例分析
2015/01/12 Python
Python json模块使用实例
2015/04/11 Python
Python pass详细介绍及实例代码
2016/11/24 Python
在Python中输入一个以空格为间隔的数组方法
2018/11/13 Python
Python 过滤错误log并导出的实例
2019/12/26 Python
Python request操作步骤及代码实例
2020/04/13 Python
Joules美国官网:出色的英国风格
2017/10/30 全球购物
Windows和Linux动态库应用异同
2016/04/17 面试题
个人评价范文分享
2014/01/11 职场文书
奶茶店创业计划书范文
2014/01/17 职场文书
售后服务承诺书
2014/03/26 职场文书
祖国在我心中演讲稿400字
2014/05/04 职场文书
提拔干部考察材料
2014/05/26 职场文书
社区科普工作方案
2014/06/03 职场文书
会计专业求职信范文
2015/03/19 职场文书
幼儿园万圣节活动总结
2015/05/05 职场文书
2016年国庆节新闻稿范文
2015/11/25 职场文书
工作一年自我鉴定
2019/06/20 职场文书
李白经典诗之一:全文无一“月”字,却句句有月
2019/07/12 职场文书
2019幼儿教师求职信(3篇)
2019/09/20 职场文书
MySQL中B树索引和B+树索引的区别详解
2022/03/03 MySQL