python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python time模块用法实例详解
Sep 11 Python
django文档学习之applications使用详解
Jan 29 Python
Python交互环境下实现输入代码
Jun 22 Python
python lxml中etree的简单应用
May 10 Python
我就是这样学习Python中的列表
Jun 02 Python
Pytorch evaluation每次运行结果不同的解决
Jan 02 Python
使用keras内置的模型进行图片预测实例
Jun 17 Python
解决Pytorch自定义层出现多Variable共享内存错误问题
Jun 28 Python
详解Python3 定义一个跨越多行的字符串的多种方法
Sep 06 Python
Selenium获取登录Cookies并添加Cookies自动登录的方法
Dec 04 Python
详解Python中的文件操作
Jan 14 Python
利用Opencv实现图片的油画特效实例
Feb 28 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
php中将数组存到文件里的实现代码
2012/01/19 PHP
php中3des加密代码(完全与.net中的兼容)
2012/08/02 PHP
php格式化日期和时间格式化示例分享
2014/02/24 PHP
PHP数组操作简单案例分析
2016/10/15 PHP
创建公共调用 jQuery Ajax 带返回值
2012/08/01 Javascript
Jquery显示、隐藏元素以及添加删除样式
2013/08/09 Javascript
JS JQUERY实现滚动条自动滚到底的方法
2015/01/09 Javascript
轻松实现javascript数据双向绑定
2015/11/11 Javascript
学习javascript面向对象 理解javascript对象
2016/01/04 Javascript
下雪了 javascript实现雪花飞舞
2020/08/02 Javascript
js实现动态创建的元素绑定事件
2016/07/19 Javascript
jQuery图片加载显示loading效果
2016/11/04 Javascript
easyui combotree加载静态数据问题(选不上)解决方法
2016/12/26 Javascript
页面缩放兼容性处理方法(zoom,Firefox火狐浏览器)
2017/08/29 Javascript
jquery ztree实现右键收藏功能
2017/11/20 jQuery
vuex 解决报错this.$store.commit is not a function的方法
2018/12/17 Javascript
详解CommonJS和ES6模块循环加载处理的区别
2018/12/26 Javascript
vue中axios实现数据交互与跨域问题
2019/05/12 Javascript
Nest.js 授权验证的方法示例
2021/02/22 Javascript
[16:43]Heroes19_剃刀(完美)
2014/10/31 DOTA
10个易被忽视但应掌握的Python基本用法
2015/04/01 Python
Python第三方库xlrd/xlwt的安装与读写Excel表格
2017/01/21 Python
深入浅析Python的类
2018/06/22 Python
Python字符串、整数、和浮点型数相互转换实例
2018/08/04 Python
python try except 捕获所有异常的实例
2018/10/18 Python
python通过paramiko复制远程文件及文件目录到本地
2019/04/30 Python
如何利用python给图片添加半透明水印
2019/09/06 Python
python 求定积分和不定积分示例
2019/11/20 Python
简单的命令查看安装的python版本号
2020/08/28 Python
浅析HTML5 meta viewport参数
2020/10/28 HTML / CSS
机械专业毕业生自荐信
2013/11/02 职场文书
企业贷款委托书格式
2014/09/12 职场文书
自我查摆剖析材料
2014/10/11 职场文书
2014年电信员工工作总结
2014/12/19 职场文书
golang 如何用反射reflect操作结构体
2021/04/28 Golang
Python实现信息管理系统
2022/06/05 Python