编程 Python

Python 文本文件内容批量抽取实例

Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据，各种心酸各种语法查找，以此留念！

原始数据格式如下图所示：

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据，其中每行第一个为测试图片编号，后面为Top 7图片编号及其对应的评分，即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来，并且将评分第二的数值与一个阈值（这里是0.7）进行比较，超过阈值表示此次测试成功，结果为正样本，记为1，否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示：

Python 文本文件内容批量抽取实例

对应的Python代码如下所示，附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表，以空格作为元素拆分标识
  #print line 返回的是一整行数据，相当于一个字符串元素
  count = len(eachline)#返回列表长度，即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件，可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Python 文本文件内容批量抽取实例

- Author -

zetn_liu

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python之模拟鼠标键盘动作具体实现

Dec 30 Python

轻松实现python搭建微信公众平台

Feb 16 Python

Python 中 Virtualenv 和 pip 的简单用法详解

Aug 18 Python

Python利用itchat对微信中好友数据实现简单分析的方法

Nov 21 Python

python opencv3实现人脸识别（windows）

May 25 Python

Python批处理删除和重命名文件夹的实例

Jul 11 Python

20行python代码的入门级小游戏的详解

May 05 Python

Numpy数组array和矩阵matrix转换方法

Aug 05 Python

python datetime时间格式的相互转换问题

Jun 11 Python

基于tensorflow __init__、build 和call的使用小结

Feb 26 Python

Python中zipfile压缩包模块的使用

May 14 Python

pytorch 中nn.Dropout的使用说明

May 20 Python

Python中作用域的深入讲解

Dec 10 #Python

python实现根据文件关键字进行切分为多个文件的示例

Dec 10 #Python

Python文件常见操作实例分析【读写、遍历】

Dec 10 #Python

一篇文章搞懂Python的类与对象名称空间

Dec 10 #Python

django使用LDAP验证的方法示例

Dec 10 #Python

python在TXT文件中按照某一字符串取出该字符串所在的行方法

Dec 10 #Python

python文件拆分与重组实例

Dec 10 #Python

You might like

php中常用编辑器推荐

2007/01/02 PHP

php页面跳转代码输入网址跳转到你定义的页面

2013/03/28 PHP

PHP APC配置文件2套和参数详解

2014/06/11 PHP

PHP实现图片上传并压缩

2015/12/22 PHP

46 个非常有用的 PHP 代码片段

2016/02/16 PHP

php删除一个路径下的所有文件夹和文件的方法

2018/02/07 PHP

jquery URL参数判断，确定菜单样式

2010/05/31 Javascript

JS实现在状态栏显示打字效果完整实例

2015/11/02 Javascript

ECMAScript6轮播图实践知识总结

2016/08/17 Javascript

jQuery图片切换动画特效

2016/11/02 Javascript

原生js简单实现放大镜特效

2017/05/16 Javascript

JavaScript闭包原理与用法实例分析

2018/08/10 Javascript

[10:21]2018DOTA2国际邀请赛寻真——Winstrike

2018/08/11 DOTA

python异常和文件处理机制详解

2016/07/19 Python

解决Python的str强转int时遇到的问题

2018/04/09 Python

python写入并获取剪切板内容的实例

2018/05/31 Python

python和pygame实现简单俄罗斯方块游戏

2021/02/19 Python

python实现祝福弹窗效果

2019/04/07 Python

利用Python进行图像的加法，图像混合(附代码)

2019/07/14 Python

Django Celery异步任务队列的实现

2019/07/24 Python

python实现递归查找某个路径下所有文件中的中文字符

2019/08/31 Python

Python+OpenCV实现图像的全景拼接

2020/03/05 Python

Python爬虫逆向分析某云音乐加密参数的实例分析

2020/12/04 Python

Expedia法国：全球最大在线旅游公司

2018/09/30 全球购物

Haglöfs瑞典官方网站：haglofs火柴棍，欧洲顶级户外品牌

2018/10/18 全球购物

彪马俄罗斯官网：PUMA俄罗斯

2019/07/13 全球购物

Feelunique德国官方网站：欧洲最大的在线美容零售商

2019/07/20 全球购物

CAT鞋加拿大官网：CAT Footwear加拿大

2020/08/05 全球购物

WEB控件及HTML服务端控件能否调用客户端方法？如果能，请解释如何调用？

2015/08/25 面试题

优秀党员获奖感言

2014/02/18 职场文书

农业局学习党的群众路线教育实践活动心得体会

2014/03/07 职场文书

中华魂演讲稿

2014/05/13 职场文书

药店促销活动策划方案

2014/08/24 职场文书

辞职信格式模板

2015/02/27 职场文书

导游词之贵州百里杜鹃

2019/10/29 职场文书

详解pytorch创建tensor函数

2022/03/22 Python