python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
学习python处理python编码问题
Mar 13 Python
python处理圆角图片、圆形图片的例子
Apr 25 Python
python中的闭包用法实例详解
May 05 Python
python统计文本文件内单词数量的方法
May 30 Python
详解python发送各类邮件的主要方法
Dec 22 Python
python添加模块搜索路径和包的导入方法
Jan 19 Python
pycharm激活码有效到2020年11月底
Sep 18 Python
pytorch 图像中的数据预处理和批标准化实例
Jan 15 Python
django xadmin 管理器常用显示设置方式
Mar 11 Python
Python新手学习函数默认参数设置
Jun 03 Python
Python偏函数Partial function使用方法实例详解
Jun 17 Python
Python爬取某平台短视频的方法
Feb 08 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
input file获得文件根目录简单实现
2013/04/26 PHP
php实现的九九乘法口诀表简洁版
2014/07/28 PHP
解决ThinkPHP关闭调试模式时报错的问题汇总
2015/04/22 PHP
PHP处理postfix邮件内容的方法
2015/06/16 PHP
jquery解决图片路径不存在执行替换路径
2013/02/06 Javascript
JS修改css样式style浅谈
2013/05/06 Javascript
jquery.post用法之type设置问题
2014/02/24 Javascript
jQuery实现的网页竖向菜单效果代码
2015/08/26 Javascript
javascript中Date format(js日期格式化)方法小结
2015/12/17 Javascript
RequireJS使用注意细节
2016/05/15 Javascript
正则表达式,替换所有HTML标签的简单实例
2016/11/28 Javascript
DOM 事件的深入浅出(二)
2016/12/05 Javascript
基于Angular.js实现的触摸滑动动画实例代码
2017/02/19 Javascript
JS实现课堂随机点名和顺序点名
2017/03/09 Javascript
在vue项目创建的后初始化首次使用stylus安装方法分享
2018/01/25 Javascript
Vue-cropper 图片裁剪的基本原理及思路讲解
2018/04/17 Javascript
浅谈Vue响应式(数组变异方法)
2018/05/07 Javascript
利用d3.js力导布局绘制资源拓扑图实例教程
2019/01/08 Javascript
nodejs实现百度舆情接口应用示例
2020/02/07 NodeJs
[06:16]DOTA2守卫传承者——职业选手谈心路历程
2015/02/26 DOTA
Python正则表达式使用经典实例
2016/06/21 Python
Windows下anaconda安装第三方包的方法小结(tensorflow、gensim为例)
2018/04/05 Python
Python3中的bytes和str类型详解
2019/05/02 Python
django formset实现数据表的批量操作的示例代码
2019/12/06 Python
python小白学习包管理器pip安装
2020/06/09 Python
Kenneth Cole官网:纽约时尚优雅品牌
2016/11/14 全球购物
POP文化和音乐灵感的时尚:Hot Topic
2019/06/19 全球购物
写一个用矩形法求定积分的通用函数
2012/11/08 面试题
文秘自荐信
2013/10/20 职场文书
个人自我鉴定
2013/11/07 职场文书
考试不及格的检讨书
2014/01/22 职场文书
环保倡议书
2014/04/14 职场文书
应届生面试求职信
2014/07/02 职场文书
教代会开幕词
2015/01/28 职场文书
党支部评议意见
2015/06/02 职场文书
学校少先队工作总结
2015/08/12 职场文书