python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python文件操作类操作实例详解
Jul 11 Python
Python映射拆分操作符用法实例
May 19 Python
Python删除windows垃圾文件的方法
Jul 14 Python
详解Python发送邮件实例
Jan 10 Python
Python实现树的先序、中序、后序排序算法示例
Jun 23 Python
python中获得当前目录和上级目录的实现方法
Oct 12 Python
Python3中条件控制、循环与函数的简易教程
Nov 21 Python
详解python函数传参是传值还是传引用
Jan 16 Python
Python子类继承父类构造函数详解
Feb 19 Python
简单了解python 邮件模块的使用方法
Jul 24 Python
python中如何使用insert函数
Jan 09 Python
解决springboot yml配置 logging.level 报错问题
Feb 21 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
yii2利用自带UploadedFile实现上传图片的示例
2017/02/16 PHP
php5.3/5.4/5.5/5.6/7常见新增特性汇总整理
2020/02/27 PHP
jquery必须知道的一些常用特效方法及使用示例(整理)
2013/06/24 Javascript
常用的JavaScript验证正则表达式汇总
2013/11/26 Javascript
node.js中的url.resolve方法使用说明
2014/12/10 Javascript
AngularJS基础学习笔记之控制器
2015/05/10 Javascript
AngularJS入门教程引导程序
2016/08/18 Javascript
jQuery实现可移动选项的左右下拉列表示例
2016/12/26 Javascript
微信小程序开发之麦克风动画 帧动画 放大 淡出
2017/04/18 Javascript
一个简易的js图片轮播效果
2017/07/22 Javascript
js封装成插件_Canvas统计图插件编写实例
2017/09/12 Javascript
node.js文件上传重命名以及移动位置的示例代码
2018/01/19 Javascript
vue实现标签云效果的方法详解
2019/08/28 Javascript
JavaScript 截取字符串代码实例
2019/09/05 Javascript
VUE子组件向父组件传值详解(含传多值及添加额外参数场景)
2020/09/01 Javascript
[05:42]DOTA2英雄梦之声_第10期_蝙蝠骑士
2014/06/21 DOTA
[37:45]完美世界DOTA2联赛PWL S3 LBZS vs Phoenix 第二场 12.09
2020/12/11 DOTA
Swift中的协议(protocol)学习教程
2016/07/08 Python
python实现闹钟定时播放音乐功能
2018/01/25 Python
Windows系统下PhantomJS的安装和基本用法
2018/10/21 Python
Python编程flask使用页面模版的方法
2018/12/28 Python
Python Numpy库常见用法入门教程
2020/01/16 Python
哪些是python中web开发框架
2020/06/17 Python
解决python运行效率不高的问题
2020/07/20 Python
Python+OpenCV图像处理——实现轮廓发现
2020/10/23 Python
python生成word合同的实例方法
2021/01/12 Python
发现两个有趣的CSS3动画效果
2013/08/14 HTML / CSS
结婚邀请函范文
2014/01/14 职场文书
大专毕业自我鉴定
2014/02/04 职场文书
任命书怎么写
2014/06/04 职场文书
2014年领导班子专项整治整改方案
2014/09/28 职场文书
高中校园广播稿
2014/10/21 职场文书
高老头读书笔记
2015/06/30 职场文书
2019学校运动会开幕词
2019/05/13 职场文书
使用numpy nonzero 找出非0元素
2021/05/14 Python
浅谈Redis中的RDB快照
2021/06/29 Redis