Python 文本文件内容批量抽取实例


Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据,各种心酸各种语法查找,以此留念!

原始数据格式如下图所示:

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据,其中每行第一个为测试图片编号,后面为Top 7图片编号及其对应的评分,即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来,并且将评分第二的数值与一个阈值(这里是0.7)进行比较,超过阈值表示此次测试成功,结果为正样本,记为1,否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示:

Python 文本文件内容批量抽取实例

对应的Python代码如下所示,附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表,以空格作为元素拆分标识
  #print line 返回的是一整行数据,相当于一个字符串元素
  count = len(eachline)#返回列表长度,即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件,可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python清除字符串里非字母字符的方法
Jul 02 Python
python实现八大排序算法(2)
Sep 14 Python
Python自定义简单图轴简单实例
Jan 08 Python
在unittest中使用 logging 模块记录测试数据的方法
Nov 30 Python
使用Python实现将list中的每一项的首字母大写
Jun 11 Python
Python selenium的基本使用方法分析
Dec 21 Python
Python如何访问字符串中的值
Feb 09 Python
Python处理PDF与CDF实例
Feb 26 Python
基于python调用jenkins-cli实现快速发布
Aug 14 Python
python实现计算器简易版
Dec 17 Python
Python基础之pandas数据合并
Apr 27 Python
python机器学习创建基于规则聊天机器人过程示例详解
Nov 02 Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
一篇文章搞懂Python的类与对象名称空间
Dec 10 #Python
django使用LDAP验证的方法示例
Dec 10 #Python
python在TXT文件中按照某一字符串取出该字符串所在的行方法
Dec 10 #Python
python文件拆分与重组实例
Dec 10 #Python
You might like
让这部DC动画新作刷新你的认知
2020/03/03 欧美动漫
PHP无刷新上传文件实现代码
2011/09/19 PHP
WordPress中Gravatar头像缓存到本地及相关优化的技巧
2015/12/19 PHP
PHP实现数据库的增删查改功能及完整代码
2018/04/18 PHP
原生PHP实现导出csv格式Excel文件的方法示例【附源码下载】
2019/03/07 PHP
PHP与Web页面交互操作实例分析
2020/06/02 PHP
JavaScript实现快速排序(自已编写)
2012/12/19 Javascript
Javascript 修改String 对象 增加去除空格功能(示例代码)
2013/11/30 Javascript
深入理解JavaScript是如何实现继承的
2013/12/12 Javascript
按钮接受回车事件的三种实现方法
2014/06/06 Javascript
JavaScript strike方法入门实例(给字符串加上删除线)
2014/10/17 Javascript
21个JavaScript事件(Events)属性汇总
2014/12/02 Javascript
js实现可输入可选择的select下拉框
2016/12/21 Javascript
angularjs实现多张图片上传并预览功能
2017/02/24 Javascript
iview中Select 选择器多选校验方法
2018/03/15 Javascript
如何使node也支持从url加载一个module详解
2018/06/05 Javascript
js表达式与运算符简单操作示例
2020/02/15 Javascript
[54:02]2018DOTA2亚洲邀请赛 4.1 小组赛 B组 IG vs VGJ.T
2018/04/03 DOTA
Python的Flask框架中实现登录用户的个人资料和头像的教程
2015/04/20 Python
python解决js文件utf-8编码乱码问题(推荐)
2018/05/02 Python
python读取Excel实例详解
2018/08/17 Python
django 自定义过滤器的实现
2019/02/26 Python
Django Rest framework解析器和渲染器详解
2019/07/25 Python
python实现京东订单推送到测试环境,提供便利操作示例
2019/08/09 Python
Python 合并拼接字符串的方法
2020/07/28 Python
python 匿名函数与三元运算学习笔记
2020/10/23 Python
澳大利亚排名第一的狂热牛仔品牌:ONETEASPOON
2018/11/20 全球购物
双立人美国官方商店:ZWILLING集团餐具和炊具
2020/05/07 全球购物
软件生产职位结构化面试主要考察要素及面试题库
2015/06/12 面试题
电子商务专业实习生自我鉴定
2013/09/24 职场文书
本科生求职简历的自我评价
2013/10/21 职场文书
家属慰问信
2015/02/14 职场文书
2015年预算员工作总结
2015/05/14 职场文书
交通安全教育主题班会
2015/08/12 职场文书
敬业奉献模范事迹材料(2016精选版)
2016/02/26 职场文书
一文了解MYSQL三大范式和表约束
2022/04/03 MySQL