Tensorflow分批量读取数据教程


Posted in Python onFebruary 07, 2020

之前的博客里使用tf读取数据都是每次fetch一条记录,实际上大部分时候需要fetch到一个batch的小批量数据,在tf中这一操作的明显变化就是tensor的rank发生了变化,我目前使用的人脸数据集是灰度图像,因此大小是92*112的,所以最开始fetch拿到的图像数据集经过reshape之后就是一个rank为2的tensor,大小是92*112的(如果考虑通道,也可以reshape为rank为3的,即92*112*1)。如果加入batch,比如batch大小为5,那么拿到的tensor的rank就变成了3,大小为5*92*112。

下面规则化的写一下读取数据的一般流程,按照官网的实例,一般把读取数据拆分成两个大部分,一个是函数专门负责读取数据和解码数据,一个函数则负责生产batch。

import tensorflow as tf

def read_data(fileNameQue):

  reader = tf.TFRecordReader()
  key, value = reader.read(fileNameQue)
  features = tf.parse_single_example(value, features={'label': tf.FixedLenFeature([], tf.int64),
                            'img': tf.FixedLenFeature([], tf.string),})
  img = tf.decode_raw(features["img"], tf.uint8)
  img = tf.reshape(img, [92,112]) # 恢复图像原始大小
  label = tf.cast(features["label"], tf.int32)

  return img, label

def batch_input(filename, batchSize):

  fileNameQue = tf.train.string_input_producer([filename], shuffle=True)
  img, label = read_data(fileNameQue) # fetch图像和label
  min_after_dequeue = 1000
  capacity = min_after_dequeue+3*batchSize
  # 预取图像和label并随机打乱,组成batch,此时tensor rank发生了变化,多了一个batch大小的维度
  exampleBatch,labelBatch = tf.train.shuffle_batch([img, label],batch_size=batchSize, capacity=capacity,
                           min_after_dequeue=min_after_dequeue)
  return exampleBatch,labelBatch

if __name__ == "__main__":

  init = tf.initialize_all_variables()
  exampleBatch, labelBatch = batch_input("./data/faceTF.tfrecords", batchSize=10)

  with tf.Session() as sess:

    sess.run(init)
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(coord=coord)

    for i in range(100):
      example, label = sess.run([exampleBatch, labelBatch])
      print(example.shape)

    coord.request_stop()
    coord.join(threads)

读取数据和解码数据与之前基本相同,针对不同格式数据集使用不同阅读器和解码器即可,后面是产生batch,核心是tf.train.shuffle_batch这个函数,它相当于一个蓄水池的功能,第一个参数代表蓄水池的入水口,也就是逐个读取到的记录,batch_size自然就是batch的大小了,capacity是蓄水池的容量,表示能容纳多少个样本,min_after_dequeue是指出队操作后还可以供随机采样出批量数据的样本池大小,显然,capacity要大于min_after_dequeue,官网推荐:min_after_dequeue + (num_threads + a small safety margin) * batch_size,还有一个参数就是num_threads,表示所用线程数目。

min_after_dequeue这个值越大,随机采样的效果越好,但是消耗的内存也越大。

以上这篇Tensorflow分批量读取数据教程就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python sort、sorted高级排序技巧
Nov 21 Python
Python脚本实现网卡流量监控
Feb 14 Python
Scrapy爬虫实例讲解_校花网
Oct 23 Python
十分钟利用Python制作属于你自己的个性logo
May 07 Python
在cmd中运行.py文件: python的操作步骤
May 12 Python
78行Python代码实现现微信撤回消息功能
Jul 26 Python
Python给图像添加噪声具体操作
Mar 03 Python
Python学习笔记之Break和Continue用法分析
Aug 14 Python
Django--权限Permissions的例子
Aug 28 Python
Python 静态方法和类方法实例分析
Nov 21 Python
Scrapy模拟登录赶集网的实现代码
Jul 07 Python
详解pandas中利用DataFrame对象的.loc[]、.iloc[]方法抽取数据
Dec 13 Python
python统计字符的个数代码实例
Feb 07 #Python
Python使用PyQt5/PySide2编写一个极简的音乐播放器功能
Feb 07 #Python
Tensorflow tf.dynamic_partition矩阵拆分示例(Python3)
Feb 07 #Python
Python reshape的用法及多个二维数组合并为三维数组的实例
Feb 07 #Python
tensorflow 利用expand_dims和squeeze扩展和压缩tensor维度方式
Feb 07 #Python
Tensorflow进行多维矩阵的拆分与拼接实例
Feb 07 #Python
Tensorflow训练模型越来越慢的2种解决方案
Feb 07 #Python
You might like
thinkphp四种url访问方式详解
2014/11/28 PHP
PHP中的use关键字及文件的加载详解
2016/11/28 PHP
JavaScript Prototype对象
2009/01/07 Javascript
GreyBox技术总结(转)
2010/11/23 Javascript
Javascript 八进制转义字符(8进制)
2011/04/08 Javascript
JQuery异步获取返回值中文乱码的解决方法
2015/01/29 Javascript
Javascript核心读书有感之词法结构
2015/02/01 Javascript
很实用的js选项卡切换效果
2016/08/12 Javascript
node.js中 stream使用教程
2016/08/28 Javascript
Jquery给当前页或者跳转后页面的导航栏添加选中后样式的实例
2016/12/08 Javascript
Vue.js学习之过滤器详解
2017/01/22 Javascript
详解tween.js 中文使用指南
2018/01/05 Javascript
JS代码实现电脑配置检测功能
2018/03/21 Javascript
vue项目中mock.js的使用及基本用法
2019/05/22 Javascript
js表达式与运算符简单操作示例
2020/02/15 Javascript
[01:19:35]DOTA2上海特级锦标赛主赛事日 - 3 败者组第三轮#2Fnatic VS OG第二局
2016/03/05 DOTA
python 实现上传图片并预览的3种方法(推荐)
2017/07/14 Python
Python程序员面试题 你必须提前准备!
2018/01/16 Python
python mac下安装虚拟环境的图文教程
2019/04/12 Python
python DES加密与解密及hex输出和bs64格式输出的实现代码
2020/04/13 Python
django实现日志按日期分割
2020/05/21 Python
CSS3 box-sizing属性详解
2016/11/15 HTML / CSS
解决margin 外边距合并问题
2019/07/03 HTML / CSS
中国专业的综合网上购物商城:京东
2016/08/02 全球购物
美国卡车、吉普车和SUV零件网站:4 Wheel Parts
2016/11/24 全球购物
介绍一下SQL注入攻击的种类和防范手段
2012/02/18 面试题
传播学专业毕业生自荐信
2013/11/04 职场文书
物业电工岗位职责
2013/11/20 职场文书
自我评价范文分享
2014/01/04 职场文书
企业管理标语
2014/06/10 职场文书
“四风”问题对照检查材料思想汇报
2014/09/16 职场文书
运动会加油稿100字
2014/09/19 职场文书
小学教师师德师风承诺书
2015/04/28 职场文书
2015年度对口支援工作总结
2015/07/22 职场文书
学习师德师风的心得体会(2篇)
2019/10/08 职场文书
死磕 java同步系列之synchronized解析
2021/06/28 Java/Android