python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python创建日历实例
Aug 21 Python
python3+mysql查询数据并通过邮件群发excel附件
Feb 24 Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 Python
python实现微信定时每天和女友发送消息
Apr 29 Python
python opencv 图像拼接的实现方法
Jun 27 Python
Python 函数用法简单示例【定义、参数、返回值、函数嵌套】
Sep 20 Python
Python3实现发送邮件和发送短信验证码功能
Jan 07 Python
Python的in,is和id函数代码实例
Apr 18 Python
Django数据统计功能count()的使用
Nov 30 Python
Python下opencv库的安装过程及问题汇总
Jun 11 Python
总结python多进程multiprocessing的相关知识
Jun 29 Python
基于Python实现对比Exce的工具
Apr 07 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
php 操作excel文件的方法小结
2009/12/31 PHP
根据分辨率不同,调用不同的css文件
2006/07/07 Javascript
javascript中直接写php代码的方法
2013/07/31 Javascript
JavaScript 垃圾回收机制分析
2013/10/10 Javascript
input禁止键盘及中文输入,但可以点击
2014/02/13 Javascript
js 数值转换为3位逗号分隔的示例代码
2014/02/19 Javascript
javascript实现给定半径求出圆的面积
2015/06/26 Javascript
jquery实现简单的轮换出现效果实例
2015/07/23 Javascript
AngularJS实现表单验证功能
2017/01/09 Javascript
easyUI combobox实现联动效果
2017/01/17 Javascript
js实现图片左右滚动效果
2017/02/27 Javascript
js省市区级联查询(插件版&amp;无插件版)
2017/03/21 Javascript
vue slot 在子组件中显示父组件传递的模板
2018/03/02 Javascript
浅析vue给不同环境配置不同打包命令
2018/08/17 Javascript
vue动画打包后失效问题的解决方法
2018/09/18 Javascript
小程序怎样让wx.navigateBack更好用的方法实现
2019/11/01 Javascript
js+canvas实现两张图片合并成一张图片的方法
2019/11/01 Javascript
bootstrap-closable-tab可实现关闭的tab标签页插件
2020/08/09 Javascript
Python实现把回车符\r\n转换成\n
2015/04/23 Python
python中argparse模块用法实例详解
2015/06/03 Python
python中多个装饰器的调用顺序详解
2019/07/16 Python
给keras层命名,并提取中间层输出值,保存到文档的实例
2020/05/23 Python
最简单的matplotlib安装教程(小白)
2020/07/28 Python
Pytest如何使用skip跳过执行测试
2020/08/13 Python
Django修改app名称和数据表迁移方案实现
2020/09/17 Python
Python3利用scapy局域网实现自动多线程arp扫描功能
2021/01/21 Python
CSS3动画:5种预载动画效果实例
2017/04/05 HTML / CSS
HTML5本地存储之IndexedDB
2017/06/16 HTML / CSS
美国名牌太阳镜折扣网站:Eyedictive
2017/05/15 全球购物
泰国时尚电商:POMELO Fashion
2020/03/11 全球购物
美国沃尔玛网上超市:Walmart
2020/08/14 全球购物
中东最大的在线宠物店:Dubai Pet Food
2020/06/11 全球购物
工作会议欢迎词
2014/01/16 职场文书
销售主管岗位职责
2014/02/08 职场文书
2015年教学管理工作总结
2015/05/20 职场文书
新闻报道稿范文
2015/07/23 职场文书