python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python多线程编程(六):可重入锁RLock
Apr 05 Python
详解Python中for循环的使用
Apr 14 Python
简单介绍Python中利用生成器实现的并发编程
May 04 Python
Python fileinput模块使用实例
Jun 03 Python
python实现写数字文件名的递增保存文件方法
Oct 25 Python
python自动发送测试报告邮件功能的实现
Jan 22 Python
Python concurrent.futures模块使用实例
Dec 24 Python
Python随机数函数代码实例解析
Feb 09 Python
Python获取二维数组的行列数的2种方法
Feb 11 Python
python如何写出表白程序
Jun 01 Python
python matplotlib绘制三维图的示例
Sep 24 Python
python palywright库基本使用
Jan 21 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
PHP提示Cannot modify header information - headers already sent by解决方法
2014/09/22 PHP
ThinkPHP打开验证码页面显示乱码的解决方法
2014/12/18 PHP
php获取从百度、谷歌等搜索引擎进入网站关键词的方法
2015/07/08 PHP
解决laravel5.4下的group by报错的问题
2019/10/16 PHP
IE8下String的Trim()方法失效的解决方法
2013/11/08 Javascript
jQuery调取jSon数据并展示的方法
2015/01/29 Javascript
js文本框走动跑马灯效果代码分享
2015/08/25 Javascript
angular 用拦截器统一处理http请求和响应的方法
2017/06/08 Javascript
详解vue-cli本地环境API代理设置和解决跨域
2017/09/05 Javascript
vue2 设置router-view默认路径的实例
2018/09/20 Javascript
Node.js如何对SQLite的async/await封装详解
2019/02/14 Javascript
JS实现简易留言板增删功能
2020/02/08 Javascript
Vue使用Ref跨层级获取组件的步骤
2021/01/25 Vue.js
[50:20]DOTA2上海特级锦标赛主赛事日 - 5 总决赛Liquid VS Secret第四局
2016/03/06 DOTA
[01:18]PWL开团时刻DAY10——一拳超人
2020/11/11 DOTA
Python语言实现获取主机名根据端口杀死进程
2016/03/31 Python
Python实现命令行通讯录实例教程
2016/08/18 Python
Python实现图片转字符画的代码实例
2019/02/22 Python
VPS CENTOS 上配置python,mysql,nginx,uwsgi,django的方法详解
2019/07/01 Python
Python图像处理之图片文字识别功能(OCR)
2019/07/30 Python
Django自带用户认证系统使用方法解析
2020/11/12 Python
阿迪达斯意大利在线商店:adidas意大利
2016/09/19 全球购物
Ralph Lauren意大利官方网站:时尚界最负盛名的品牌之一
2018/10/18 全球购物
中兴通讯全球官方网站:ZTE
2020/12/26 全球购物
物业客服专员岗位职责
2013/11/30 职场文书
销售主管岗位职责
2014/02/08 职场文书
讲文明树新风公益广告宣传方案
2014/02/25 职场文书
科学发展观演讲稿
2014/09/11 职场文书
大学生第一学年自我鉴定
2014/09/12 职场文书
幼儿园开学家长寄语(2015秋季)
2015/05/27 职场文书
给学校的建议书400字
2015/09/14 职场文书
《彼得与狼》教学反思
2016/02/20 职场文书
公司晚会主持词
2019/04/17 职场文书
选择比努力更重要?这是长期以来对“努力”的最大误解
2019/07/12 职场文书
sql字段解析器的实现示例
2021/06/23 SQL Server
Python可视化学习之matplotlib内置单颜色
2022/02/24 Python