python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
py中的目录与文件判别代码
Jul 16 Python
python实现360的字符显示界面
Feb 21 Python
最基础的Python的socket编程入门教程
Apr 23 Python
使用Python编写基于DHT协议的BT资源爬虫
Mar 19 Python
centos6.7安装python2.7.11的具体方法
Jan 16 Python
python实现决策树分类
Aug 30 Python
PyQt5使用QTimer实现电子时钟
Jul 29 Python
python-序列解包(对可迭代元素的快速取值方法)
Aug 24 Python
Python阶乘求和的代码详解
Feb 14 Python
pytorch 使用加载训练好的模型做inference
Feb 20 Python
基于Python pyecharts实现多种图例代码解析
Aug 10 Python
python数字图像处理之对比度与亮度调整示例
Jun 28 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
使用php语句将数据库*.sql文件导入数据库
2014/05/05 PHP
写一段简单的PHP建立文件夹代码
2015/01/06 PHP
php使用substr()和strpos()联合查找字符串中某一特定字符的方法
2015/05/12 PHP
PHP实现多级分类生成树的方法示例
2017/02/07 PHP
如何在Laravel之外使用illuminate组件详解
2020/09/20 PHP
JavaScript中的私有成员
2006/09/18 Javascript
js 数组克隆方法 小结
2010/03/20 Javascript
jquery ready函数、css函数及text()使用示例
2013/09/27 Javascript
jqgrid 表格数据导出实例
2013/11/21 Javascript
jQuery.position()方法获取不到值的安全替换方法
2015/03/13 Javascript
BootStrap制作导航条实例代码
2016/05/06 Javascript
JS实现table表格数据排序功能(可支持动态数据+分页效果)
2016/05/26 Javascript
bootstrap-wysiwyg结合ajax实现图片上传实时刷新功能
2016/05/27 Javascript
详解Bootstrap的iCheck插件checkbox和radio
2016/08/24 Javascript
vue2.0获取自定义属性的值
2017/03/28 Javascript
Vue.js中轻松解决v-for执行出错的三个方案
2017/06/09 Javascript
vue.js中proxyTable 转发请求的实现方法
2018/09/20 Javascript
JS浮点数运算结果不精确的Bug解决
2019/08/01 Javascript
分享8个JavaScript库可更好地处理本地存储
2020/10/12 Javascript
Javascript柯里化实现原理及作用解析
2020/10/22 Javascript
python实现对一个完整url进行分割的方法
2015/04/29 Python
Python中property属性实例解析
2018/02/10 Python
python 解压pkl文件的方法
2018/10/25 Python
Python使用requests xpath 并开启多线程爬取西刺代理ip实例
2020/03/06 Python
python matplotlib 绘图 和 dpi对应关系详解
2020/03/14 Python
Python结合Window计划任务监测邮件的示例代码
2020/08/05 Python
Linux常见面试题
2013/03/18 面试题
探亲邀请信范文
2014/01/30 职场文书
优秀语文教师事迹
2014/05/18 职场文书
2014年教育工作总结
2014/11/26 职场文书
给校长的建议书作文400字
2015/09/14 职场文书
创业计划书之香辣虾火锅
2019/09/23 职场文书
七年级作文之下雨天
2019/12/23 职场文书
MYSQL数据库使用UTF-8中文编码乱码的解决办法
2021/05/26 MySQL
SpringBoot中使用Redis作为全局锁示例过程
2022/03/24 Java/Android
Dubbo+zookeeper搭配分布式服务的过程详解
2022/04/03 Java/Android