Python 文本文件内容批量抽取实例


Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据,各种心酸各种语法查找,以此留念!

原始数据格式如下图所示:

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据,其中每行第一个为测试图片编号,后面为Top 7图片编号及其对应的评分,即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来,并且将评分第二的数值与一个阈值(这里是0.7)进行比较,超过阈值表示此次测试成功,结果为正样本,记为1,否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示:

Python 文本文件内容批量抽取实例

对应的Python代码如下所示,附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表,以空格作为元素拆分标识
  #print line 返回的是一整行数据,相当于一个字符串元素
  count = len(eachline)#返回列表长度,即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件,可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的匿名函数使用简介
Apr 27 Python
python实现爬虫统计学校BBS男女比例(一)
Dec 31 Python
Python复数属性和方法运算操作示例
Jul 21 Python
Python制作豆瓣图片的爬虫
Dec 28 Python
Numpy掩码式数组详解
Apr 17 Python
Python实现获取邮箱内容并解析的方法示例
Jun 16 Python
Pandas中Series和DataFrame的索引实现
Jun 27 Python
python 已知一个字符,在一个list中找出近似值或相似值实现模糊匹配
Feb 29 Python
使用Python将图片转正方形的两种方法实例代码详解
Apr 29 Python
浅谈Keras参数 input_shape、input_dim和input_length用法
Jun 29 Python
keras分类之二分类实例(Cat and dog)
Jul 09 Python
Django对接elasticsearch实现全文检索的示例代码
Aug 02 Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
一篇文章搞懂Python的类与对象名称空间
Dec 10 #Python
django使用LDAP验证的方法示例
Dec 10 #Python
python在TXT文件中按照某一字符串取出该字符串所在的行方法
Dec 10 #Python
python文件拆分与重组实例
Dec 10 #Python
You might like
深入理解PHP原理之异常机制
2010/08/21 PHP
解读PHP的Yii框架中请求与响应的处理流程
2016/03/17 PHP
PHP二维数组矩形转置实例
2016/07/20 PHP
可实现多表单提交的javascript函数
2007/08/01 Javascript
js 单引号 传递方法
2009/06/22 Javascript
JavaScript Event学习第八章 事件的顺序
2010/02/07 Javascript
JavaScript简单修改窗口大小的方法
2015/08/03 Javascript
浅谈jQuery中的checkbox问题
2016/08/10 Javascript
详解Vue整合axios的实例代码
2017/06/21 Javascript
Vue filters过滤器的使用方法
2017/07/14 Javascript
JS实现身份证输入框的输入效果
2017/08/21 Javascript
360doc网站不登录就无法复制内容的解决方法
2018/01/27 Javascript
JS使用正则表达式获取小括号、中括号及花括号内容的方法示例
2018/06/01 Javascript
JavaScript中创建原子的方法总结
2018/08/26 Javascript
浅析微信扫码登录原理(小结)
2018/10/29 Javascript
js中offset,client , scroll 三大元素知识点总结
2019/09/11 Javascript
vue进入页面时不在顶部,检测滚动返回顶部按钮问题及解决方法
2019/10/30 Javascript
vue把输入框的内容添加到页面的实例讲解
2019/11/11 Javascript
js+canvas实现刮刮奖功能
2020/09/13 Javascript
javascript中导出与导入实现模块化管理教程
2020/12/03 Javascript
Python 学习笔记
2008/12/27 Python
Python单元测试框架unittest使用方法讲解
2015/04/13 Python
Python实用日期时间处理方法汇总
2015/05/09 Python
Python中用altzone()方法处理时区的教程
2015/05/22 Python
简单讲解Python编程中namedtuple类的用法
2016/06/21 Python
在python中使用正则表达式查找可嵌套字符串组
2017/10/24 Python
Python Nose框架编写测试用例方法
2017/10/26 Python
法国家具及室内配件店:home24
2017/01/21 全球购物
Windows和Linux动态库应用异同
2016/07/28 面试题
医院总经理职责
2013/12/26 职场文书
九年级家长会邀请函
2014/01/15 职场文书
消防安全汇报材料
2014/02/08 职场文书
奉献家乡演讲稿
2014/09/13 职场文书
新员工考核评语
2014/12/31 职场文书
2015年父亲节活动总结
2015/02/12 职场文书
答谢酒会主持词
2015/07/02 职场文书