python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中Matplotlib实现绘制3D图的示例代码
Sep 04 Python
Python内置模块turtle绘图详解
Dec 09 Python
Pandas:Series和DataFrame删除指定轴上数据的方法
Nov 10 Python
python3 实现对图片进行局部切割的方法
Dec 05 Python
python3 字符串/列表/元组(str/list/tuple)相互转换方法及join()函数的使用
Apr 03 Python
Python搭建Spark分布式集群环境
Jul 05 Python
Python目录和文件处理总结详解
Sep 02 Python
详解Python中打乱列表顺序random.shuffle()的使用方法
Nov 11 Python
Python底层封装实现方法详解
Jan 22 Python
python pymysql库的常用操作
Oct 16 Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 Python
Python3使用Qt5来实现简易的五子棋小游戏
May 02 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
PHP结合Ueditor并修改图片上传路径
2016/10/16 PHP
php传值和传引用的区别点总结
2019/11/19 PHP
laravel框架语言包拓展实现方法分析
2019/11/22 PHP
JavaScript 判断浏览器类型及版本
2009/02/21 Javascript
DOM 脚本编程中的兄弟节点
2009/10/31 Javascript
JavaScript CSS修改学习第五章 给“上传”添加样式
2010/02/19 Javascript
js操作时间(年-月-日 时-分-秒 星期几)
2010/06/20 Javascript
JavaScript字符串String和Array操作的有趣方法
2012/12/18 Javascript
JavaScript控制Session操作方法
2013/01/17 Javascript
JavaScript中判断对象类型的几种方法总结
2013/11/11 Javascript
js模仿hover的具体实现代码
2013/12/30 Javascript
JSONP获取Twitter和Facebook文章数的具体步骤
2014/02/24 Javascript
浏览器窗口加载和大小改变事件示例
2014/02/27 Javascript
javascript 模拟坦克大战游戏(html5版)附源码下载
2014/04/08 Javascript
详解Vue、element-ui、axios实现省市区三级联动
2019/05/07 Javascript
javascript实现简单打字游戏
2019/10/29 Javascript
使用pkg打包ThinkJS项目的方法步骤
2019/12/30 Javascript
[01:01:41]DOTA2-DPC中国联赛 正赛 PSG.LGD vs Magma BO3 第二场 1月31日
2021/03/11 DOTA
Python中用Decorator来简化元编程的教程
2015/04/13 Python
实例解析Python设计模式编程之桥接模式的运用
2016/03/02 Python
Python正则抓取新闻标题和链接的方法示例
2017/04/24 Python
图解Python变量与赋值
2018/04/03 Python
Python基于pandas实现json格式转换成dataframe的方法
2018/06/22 Python
python scp 批量同步文件的实现方法
2019/01/03 Python
在Python IDLE 下调用anaconda中的库教程
2020/03/09 Python
HTML5中input[type='date']自定义样式与日历校验功能的实现代码
2017/07/11 HTML / CSS
水利公司纪检监察自我鉴定
2014/02/25 职场文书
初三开学计划书
2014/04/27 职场文书
大学生精神文明先进个人事迹材料
2014/05/02 职场文书
领导班子作风建设剖析材料
2014/10/11 职场文书
2014年社区宣传工作总结
2014/12/02 职场文书
2014年社区工会工作总结
2014/12/18 职场文书
公司行政管理制度范本
2015/08/05 职场文书
2019入党申请书范文3篇
2019/08/21 职场文书
XX部保密工作制度范本
2019/08/27 职场文书
Python 处理表格进行成绩排序的操作代码
2021/07/26 Python