python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python分析git log日志示例
Feb 27 Python
Python运用于数据分析的简单教程
Mar 27 Python
Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法
Apr 24 Python
安装Python的web.py框架并从hello world开始编程
Apr 25 Python
python提取页面内url列表的方法
May 25 Python
Python3.5面向对象程序设计之类的继承和多态详解
Apr 24 Python
python中的反斜杠问题深入讲解
Aug 12 Python
python求平均数、方差、中位数的例子
Aug 22 Python
python3读取csv文件任意行列代码实例
Jan 13 Python
windows上彻底删除jupyter notebook的实现
Apr 13 Python
使用keras和tensorflow保存为可部署的pb格式
May 25 Python
python3.9之你应该知道的新特性详解
Apr 29 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
php接口与接口引用的深入解析
2013/08/09 PHP
PHP的Yii框架的常用日志操作总结
2015/12/08 PHP
Laravel + Elasticsearch 实现中文搜索的方法
2020/02/02 PHP
web css实现整站样式互相切换
2013/10/29 Javascript
javascript原型链继承用法实例分析
2015/01/28 Javascript
jQuery控制网页打印指定区域的方法
2015/04/07 Javascript
jquery的幻灯片图片切换效果代码分享
2015/09/07 Javascript
JS中判断字符串中出现次数最多的字符及出现的次数的简单实例
2016/06/03 Javascript
jQuery解析与处理服务器端返回xml格式数据的方法详解
2016/07/04 Javascript
JQueryEasyUI之DataGrid数据显示
2016/11/23 Javascript
微信小程序图表插件(wx-charts)实例代码
2017/01/17 Javascript
bootstrap jquery dataTable 异步ajax刷新表格数据的实现方法
2017/02/10 Javascript
jQuery实用密码强度检测
2017/03/02 Javascript
node.js中cluster的使用教程
2017/06/09 Javascript
详解Vue如何支持JSX语法
2017/11/10 Javascript
Angular7创建项目、组件、服务以及服务的使用
2019/02/19 Javascript
nodejs中各种加密算法的实现详解
2019/07/11 NodeJs
[44:50]2018DOTA2亚洲邀请赛 4.1 小组赛 A组 TNC vs VG
2018/04/02 DOTA
python通过apply使用元祖和列表调用函数实例
2015/05/26 Python
Windows下的Python 3.6.1的下载与安装图文详解(适合32位和64位)
2018/02/21 Python
pyqt5实现俄罗斯方块游戏
2019/01/11 Python
python导入pandas具体步骤方法
2019/06/23 Python
python里的单引号和双引号的有什么作用
2020/06/17 Python
python 删除系统中的文件(按时间,大小,扩展名)
2020/11/19 Python
HTML5 canvas基本绘图之绘制线段
2016/06/27 HTML / CSS
兼职学生的自我评价
2013/11/24 职场文书
班长竞选演讲稿
2014/04/24 职场文书
同志主要表现材料
2014/08/21 职场文书
小学生美德少年事迹材料
2014/08/24 职场文书
优秀小学生事迹材料
2014/12/26 职场文书
开票员岗位职责
2015/02/12 职场文书
员工家属慰问信
2015/03/24 职场文书
学校团代会开幕词
2016/03/04 职场文书
六一儿童节致辞稿(3篇)
2019/07/11 职场文书
Java获取e.printStackTrace()打印的信息方式
2021/08/07 Java/Android
win10壁纸在哪个文件夹 win10桌面背景图片文件位置分享
2022/08/05 数码科技