Python 文本文件内容批量抽取实例


Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据,各种心酸各种语法查找,以此留念!

原始数据格式如下图所示:

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据,其中每行第一个为测试图片编号,后面为Top 7图片编号及其对应的评分,即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来,并且将评分第二的数值与一个阈值(这里是0.7)进行比较,超过阈值表示此次测试成功,结果为正样本,记为1,否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示:

Python 文本文件内容批量抽取实例

对应的Python代码如下所示,附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表,以空格作为元素拆分标识
  #print line 返回的是一整行数据,相当于一个字符串元素
  count = len(eachline)#返回列表长度,即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件,可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python之模拟鼠标键盘动作具体实现
Dec 30 Python
轻松实现python搭建微信公众平台
Feb 16 Python
Python 中 Virtualenv 和 pip 的简单用法详解
Aug 18 Python
Python利用itchat对微信中好友数据实现简单分析的方法
Nov 21 Python
python opencv3实现人脸识别(windows)
May 25 Python
Python批处理删除和重命名文件夹的实例
Jul 11 Python
20行python代码的入门级小游戏的详解
May 05 Python
Numpy数组array和矩阵matrix转换方法
Aug 05 Python
python datetime时间格式的相互转换问题
Jun 11 Python
基于tensorflow __init__、build 和call的使用小结
Feb 26 Python
Python中zipfile压缩包模块的使用
May 14 Python
pytorch 中nn.Dropout的使用说明
May 20 Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
一篇文章搞懂Python的类与对象名称空间
Dec 10 #Python
django使用LDAP验证的方法示例
Dec 10 #Python
python在TXT文件中按照某一字符串取出该字符串所在的行方法
Dec 10 #Python
python文件拆分与重组实例
Dec 10 #Python
You might like
php中常用编辑器推荐
2007/01/02 PHP
php页面跳转代码 输入网址跳转到你定义的页面
2013/03/28 PHP
PHP APC配置文件2套和参数详解
2014/06/11 PHP
PHP实现图片上传并压缩
2015/12/22 PHP
46 个非常有用的 PHP 代码片段
2016/02/16 PHP
php删除一个路径下的所有文件夹和文件的方法
2018/02/07 PHP
jquery URL参数判断,确定菜单样式
2010/05/31 Javascript
JS实现在状态栏显示打字效果完整实例
2015/11/02 Javascript
ECMAScript6轮播图实践知识总结
2016/08/17 Javascript
jQuery图片切换动画特效
2016/11/02 Javascript
原生js简单实现放大镜特效
2017/05/16 Javascript
JavaScript闭包原理与用法实例分析
2018/08/10 Javascript
[10:21]2018DOTA2国际邀请赛寻真——Winstrike
2018/08/11 DOTA
python异常和文件处理机制详解
2016/07/19 Python
解决Python的str强转int时遇到的问题
2018/04/09 Python
python写入并获取剪切板内容的实例
2018/05/31 Python
python和pygame实现简单俄罗斯方块游戏
2021/02/19 Python
python实现祝福弹窗效果
2019/04/07 Python
利用Python进行图像的加法,图像混合(附代码)
2019/07/14 Python
Django Celery异步任务队列的实现
2019/07/24 Python
python实现递归查找某个路径下所有文件中的中文字符
2019/08/31 Python
Python+OpenCV实现图像的全景拼接
2020/03/05 Python
Python爬虫逆向分析某云音乐加密参数的实例分析
2020/12/04 Python
Expedia法国:全球最大在线旅游公司
2018/09/30 全球购物
Haglöfs瑞典官方网站:haglofs火柴棍,欧洲顶级户外品牌
2018/10/18 全球购物
彪马俄罗斯官网:PUMA俄罗斯
2019/07/13 全球购物
Feelunique德国官方网站:欧洲最大的在线美容零售商
2019/07/20 全球购物
CAT鞋加拿大官网:CAT Footwear加拿大
2020/08/05 全球购物
WEB控件及HTML服务端控件能否调用客户端方法?如果能,请解释如何调用?
2015/08/25 面试题
优秀党员获奖感言
2014/02/18 职场文书
农业局学习党的群众路线教育实践活动心得体会
2014/03/07 职场文书
中华魂演讲稿
2014/05/13 职场文书
药店促销活动策划方案
2014/08/24 职场文书
辞职信格式模板
2015/02/27 职场文书
导游词之贵州百里杜鹃
2019/10/29 职场文书
详解pytorch创建tensor函数
2022/03/22 Python