python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用mysqldb连接数据库操作方法示例详解
Dec 03 Python
Python XML RPC服务器端和客户端实例
Nov 22 Python
python django事务transaction源码分析详解
Mar 17 Python
python爬虫实战之爬取京东商城实例教程
Apr 24 Python
python爬取拉勾网职位数据的方法
Jan 24 Python
Python实现识别手写数字大纲
Jan 29 Python
对pandas中Series的map函数详解
Jul 25 Python
Python数据结构之栈、队列及二叉树定义与用法浅析
Dec 27 Python
python导入pandas具体步骤方法
Jun 23 Python
Python循环实现n的全排列功能
Sep 16 Python
Keras模型转成tensorflow的.pb操作
Jul 06 Python
Python 数据科学 Matplotlib图库详解
Jul 07 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
PHP开发不能违背的安全规则 过滤用户输入
2011/05/01 PHP
用PHP做了一个领取优惠券活动的示例代码
2019/07/05 PHP
php框架知识点的整理和补充
2021/03/01 PHP
jQuery Mobile页面跳转后未加载外部JS原因分析及解决
2013/03/18 Javascript
JS清空多文本框、文本域示例代码
2014/02/24 Javascript
简单方法判断JavaScript对象为null或者属性为空
2014/09/26 Javascript
JavaScript中split() 使用方法汇总
2015/04/17 Javascript
JavaScript制作淘宝星级评分效果的思路
2020/06/23 Javascript
js实现继承的5种方式
2015/12/01 Javascript
最简单纯JavaScript实现Tab标签页切换的方式(推荐)
2016/07/25 Javascript
微信小程序实现图片预加载组件
2017/01/18 Javascript
详细介绍RxJS在Angular中的应用
2017/09/23 Javascript
JS获取当前地理位置的方法
2017/10/25 Javascript
Vue.js组件间的循环引用方法示例
2017/12/27 Javascript
webstorm和.vue中es6语法报错的解决方法
2018/05/08 Javascript
小程序实现层叠卡片滑动效果
2019/08/26 Javascript
vue实现倒计时获取验证码效果
2020/04/17 Javascript
JavaScript算法学习之冒泡排序和选择排序
2019/11/02 Javascript
javascript全局自定义鼠标右键菜单
2020/12/08 Javascript
Python中GeoJson和bokeh-1的使用讲解
2019/01/03 Python
Django使用中间键实现csrf认证详解
2019/07/22 Python
Django Python 获取请求头信息Content-Range的方法
2019/08/06 Python
python爬取微博评论的实例讲解
2021/01/15 Python
应届生保险求职信
2013/11/11 职场文书
装饰资料员岗位职责
2013/12/30 职场文书
公司培训欢迎词
2014/01/10 职场文书
大学校园活动策划书
2014/02/04 职场文书
作文批改评语大全
2014/04/23 职场文书
小学标准化建设汇报材料
2014/08/16 职场文书
2015年学雷锋活动总结
2015/02/06 职场文书
管理失职检讨书
2015/05/05 职场文书
食品安全责任书范本
2015/05/09 职场文书
企业愿景口号
2015/12/25 职场文书
MySQL系列之七 MySQL存储引擎
2021/07/02 MySQL
python编程简单几行代码实现视频转换Gif示例
2021/10/05 Python
详解在OpenCV中如何使用图像像素
2022/03/03 Python