python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中turtle作图示例
Nov 15 Python
python中的迭代和可迭代对象代码示例
Dec 27 Python
解决python nohup linux 后台运行输出的问题
May 11 Python
对pandas的算术运算和数据对齐实例详解
Dec 22 Python
python采集百度搜索结果带有特定URL的链接代码实例
Aug 30 Python
Python Pandas 对列/行进行选择,增加,删除操作
May 17 Python
OpenCV 之按位运算举例解析
Jun 19 Python
python怎么判断模块安装完成
Jun 19 Python
关于探究python中sys.argv时遇到的问题详解
Feb 23 Python
浅谈Python 中的复数问题
May 19 Python
PyQt5实现多张图片显示并滚动
Jun 11 Python
python获取对象信息的实例详解
Jul 07 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
PHP错误Cannot use object of type stdClass as array in错误的解决办法
2014/06/12 PHP
destoon供应信息title调用出公司名称的方法
2014/08/22 PHP
zend framework重定向方法小结
2016/05/28 PHP
laravel5.2实现区分前后台用户登录的方法
2017/01/11 PHP
Thinkphp 3.2框架使用Redis的方法详解
2019/10/24 PHP
深入理解JavaScript系列(10) JavaScript核心(晋级高手必读篇)
2012/01/15 Javascript
Javascript基础教程之for循环
2015/01/18 Javascript
js控制多图左右滚动切换效果代码分享
2015/08/26 Javascript
详解Wondows下Node.js使用MongoDB的环境配置
2016/03/01 Javascript
基于RequireJS和JQuery的模块化编程日常问题解析
2016/04/14 Javascript
JS Canvas定时器模拟动态加载动画
2016/09/17 Javascript
Ajax+FormData+javascript实现无刷新表单信息提交
2016/10/24 Javascript
vue.js学习笔记:如何加载本地json文件
2017/01/17 Javascript
Windows下使用Nodejs运行js的方法
2017/09/02 NodeJs
Three.js利用dat.GUI如何简化试验流程详解
2017/09/26 Javascript
JS动态添加的div点击跳转到另一页面实现代码
2017/09/30 Javascript
vue-devtools的安装步骤
2018/04/23 Javascript
js实现时钟定时器
2020/03/26 Javascript
原生js拖拽功能制作滑动条实例代码
2021/02/05 Javascript
在python环境下运用kafka对数据进行实时传输的方法
2018/12/27 Python
使用python批量修改文件名的方法(视频合并时)
2020/03/24 Python
使用Python代码实现Linux中的ls遍历目录命令的实例代码
2019/09/07 Python
Python 函数绘图及函数图像微分与积分
2019/11/20 Python
python 写函数在一定条件下需要调用自身时的写法说明
2020/06/01 Python
一款纯css3制作的2015年元旦雪人动画特效教程
2014/12/29 HTML / CSS
html5 http的轮询和Websocket原理
2018/10/19 HTML / CSS
Woolworth官网:澳洲第一大超市
2017/06/25 全球购物
印度尼西亚最大的电商平台:Tokopedia(印尼版淘宝)
2017/12/02 全球购物
编写函数,将一个3*3矩阵转置
2013/10/09 面试题
公益广告语集锦
2014/03/13 职场文书
感恩祖国演讲稿
2014/09/09 职场文书
2015年世界粮食日演讲稿
2015/03/20 职场文书
幼儿园园长安全责任书
2015/05/08 职场文书
描写九月优美句子(39条)
2019/09/11 职场文书
微信小程序用户授权最佳实践指南
2021/05/08 Javascript
Python编写车票订购系统 Python实现快递收费系统
2022/08/14 Python