Python 文本文件内容批量抽取实例


Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据,各种心酸各种语法查找,以此留念!

原始数据格式如下图所示:

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据,其中每行第一个为测试图片编号,后面为Top 7图片编号及其对应的评分,即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来,并且将评分第二的数值与一个阈值(这里是0.7)进行比较,超过阈值表示此次测试成功,结果为正样本,记为1,否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示:

Python 文本文件内容批量抽取实例

对应的Python代码如下所示,附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表,以空格作为元素拆分标识
  #print line 返回的是一整行数据,相当于一个字符串元素
  count = len(eachline)#返回列表长度,即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件,可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python刷投票的脚本实现代码
Nov 08 Python
python编程实现随机生成多个椭圆实例代码
Jan 03 Python
为什么选择python编程语言入门黑客攻防 给你几个理由!
Feb 02 Python
python通过配置文件共享全局变量的实例
Jan 11 Python
Python检查 云备份进程是否正常运行代码实例
Aug 22 Python
基于python实现雪花算法过程详解
Nov 16 Python
python matplotlib中的subplot函数使用详解
Jan 19 Python
python3实现名片管理系统(控制台版)
Nov 29 Python
Python调用SMTP服务自动发送Email的实现步骤
Feb 07 Python
python 获取域名到期时间的方法步骤
Feb 10 Python
python3 hdf5文件 遍历代码
May 19 Python
解决pytorch 损失函数中输入输出不匹配的问题
Jun 05 Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
一篇文章搞懂Python的类与对象名称空间
Dec 10 #Python
django使用LDAP验证的方法示例
Dec 10 #Python
python在TXT文件中按照某一字符串取出该字符串所在的行方法
Dec 10 #Python
python文件拆分与重组实例
Dec 10 #Python
You might like
功能强大的php分页函数
2016/07/20 PHP
yii2多图上传组件的使用教程
2018/05/10 PHP
cssQuery()的下载与使用方法
2007/01/12 Javascript
jquery下checked取值问题的解决方法
2012/08/09 Javascript
JS不间断向上滚动效果代码
2013/12/25 Javascript
window.open()详解及浏览器兼容性问题示例探讨
2014/05/29 Javascript
jQuery实现Twitter的自动文字补齐特效
2014/11/28 Javascript
原生Js实现简易烟花爆炸效果的方法
2015/03/20 Javascript
jquery实现Li滚动时滚动条自动添加样式的方法
2015/08/10 Javascript
jquery.validate 自定义验证方法及validate相关参数
2016/01/18 Javascript
简单理解JavaScript中的封装与继承特性
2016/03/19 Javascript
JavaScript代码实现左右上下自动晃动自动移动
2016/04/08 Javascript
vue 父组件调用子组件方法及事件
2018/03/29 Javascript
解决vue同一slot在组件中渲染多次的问题
2018/09/06 Javascript
bootstrap与pagehelper实现分页效果
2018/12/29 Javascript
详解vite+ts快速搭建vue3项目以及介绍相关特性
2021/02/25 Vue.js
[01:15:36]加油刀塔第二期网络版
2014/08/09 DOTA
使用Python的Zato发送AMQP消息的教程
2015/04/16 Python
通过Python使用saltstack生成服务器资产清单
2016/03/01 Python
python实现折半查找和归并排序算法
2017/04/14 Python
Python IDLE清空窗口的实例
2018/06/25 Python
python实现爬山算法的思路详解
2019/04/09 Python
python列表推导和生成器表达式知识点总结
2020/01/10 Python
Keras SGD 随机梯度下降优化器参数设置方式
2020/06/19 Python
HTML5使用Audio标签实现歌词同步的效果
2016/03/17 HTML / CSS
英国最大的专业户外零售商:Mountain Warehouse
2018/06/06 全球购物
Muziker英国:中欧最大的音乐家商店
2020/02/05 全球购物
专科文秘应届生求职信
2013/11/18 职场文书
运动会四百米广播稿
2014/01/19 职场文书
地质工程专业毕业生求职信
2014/08/08 职场文书
2015年保险公司内勤工作总结
2015/05/23 职场文书
新年晚会开场白
2015/05/29 职场文书
网吧管理制度范本
2015/08/05 职场文书
Python实现Telnet自动连接检测密码的示例
2021/04/16 Python
Java移除无效括号的方法实现
2021/08/07 Java/Android
浅谈Redis变慢的原因及排查方法
2022/06/21 Redis