Python 文本文件内容批量抽取实例


Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据,各种心酸各种语法查找,以此留念!

原始数据格式如下图所示:

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据,其中每行第一个为测试图片编号,后面为Top 7图片编号及其对应的评分,即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来,并且将评分第二的数值与一个阈值(这里是0.7)进行比较,超过阈值表示此次测试成功,结果为正样本,记为1,否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示:

Python 文本文件内容批量抽取实例

对应的Python代码如下所示,附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表,以空格作为元素拆分标识
  #print line 返回的是一整行数据,相当于一个字符串元素
  count = len(eachline)#返回列表长度,即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件,可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 Python
python使用pyhook监控键盘并实现切换歌曲的功能
Jul 18 Python
python用10行代码实现对黄色图片的检测功能
Aug 10 Python
python中的break、continue、exit()、pass全面解析
Aug 05 Python
解决Python网页爬虫之中文乱码问题
May 11 Python
python2.7实现邮件发送功能
Dec 12 Python
pandas 数据索引与选取的实现方法
Jun 21 Python
python增加图像对比度的方法
Jul 12 Python
简单了解Python3 bytes和str类型的区别和联系
Dec 19 Python
Python中pyecharts安装及安装失败的解决方法
Feb 18 Python
如何利用pycharm进行代码更新比较
Nov 04 Python
Python实现的扫码工具居然这么好用!
Jun 07 Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
一篇文章搞懂Python的类与对象名称空间
Dec 10 #Python
django使用LDAP验证的方法示例
Dec 10 #Python
python在TXT文件中按照某一字符串取出该字符串所在的行方法
Dec 10 #Python
python文件拆分与重组实例
Dec 10 #Python
You might like
php可变长参数处理函数详解
2017/02/22 PHP
TP5框架实现签到功能的方法分析
2020/04/05 PHP
使用js+jquery实现无限极联动
2013/05/23 Javascript
ie8模式下click无反应点击option无反应的解决方法
2014/10/11 Javascript
JavaScript中的eval()函数使用介绍
2014/12/31 Javascript
jQuery 中的 DOM 操作
2016/04/26 Javascript
详解Angular结合zTree异步加载节点数据
2018/01/20 Javascript
解决Jquery下拉框数据动态获取的问题
2018/01/25 jQuery
使用layui日期控件laydate对开始和结束时间进行联动控制的方法
2019/09/06 Javascript
vuejs中父子组件之间通信方法实例详解
2020/01/17 Javascript
jQuery实现简单评论功能
2020/08/19 jQuery
用vue设计一个日历表
2020/12/03 Vue.js
使用Python对Csv文件操作实例代码
2017/05/12 Python
Python之自动获取公网IP的实例讲解
2017/10/01 Python
详解windows python3.7安装numpy问题的解决方法
2018/08/13 Python
Pycharm 文件更改目录后,执行路径未更新的解决方法
2019/07/19 Python
python numpy数组中的复制知识解析
2020/02/03 Python
python3 sleep 延时秒 毫秒实例
2020/05/04 Python
IntelliJ 中配置 Anaconda的过程图解
2020/06/01 Python
Django多数据库联用实现方法解析
2020/11/12 Python
详解win10下pytorch-gpu安装以及CUDA详细安装过程
2021/01/28 Python
前端canvas动画如何转成mp4视频的方法
2019/06/17 HTML / CSS
乌克兰在线商店的价格比较:Price.ua
2019/07/26 全球购物
skyn ICELAND官网:冰岛成分天然护肤品
2020/08/24 全球购物
介绍一下linux文件系统分配策略
2012/11/17 面试题
运动会解说词50字
2014/01/18 职场文书
十八大演讲稿
2014/05/22 职场文书
优秀工会工作者事迹材料
2014/06/02 职场文书
企业安全标语
2014/06/07 职场文书
节能减耗标语
2014/06/21 职场文书
2014年技术工作总结范文
2014/11/20 职场文书
2015年度保密工作总结
2015/04/24 职场文书
2016优秀班主任个人先进事迹材料
2016/02/26 职场文书
Pytorch中Softmax和LogSoftmax的使用详解
2021/06/05 Python
使用Redis实现点赞取消点赞的详细代码
2022/03/20 Redis
Python中使用tkFileDialog实现文件选择、保存和路径选择
2022/05/20 Python