Tensorflow 实现分批量读取数据


Posted in Python onJanuary 04, 2020

之前的博客里使用tf读取数据都是每次fetch一条记录,实际上大部分时候需要fetch到一个batch的小批量数据,在tf中这一操作的明显变化就是tensor的rank发生了变化,我目前使用的人脸数据集是灰度图像,因此大小是92*112的,所以最开始fetch拿到的图像数据集经过reshape之后就是一个rank为2的tensor,大小是92*112的(如果考虑通道,也可以reshape为rank为3的,即92*112*1)。

如果加入batch,比如batch大小为5,那么拿到的tensor的rank就变成了3,大小为5*92*112。

下面规则化的写一下读取数据的一般流程,按照官网的实例,一般把读取数据拆分成两个大部分,一个是函数专门负责读取数据和解码数据,一个函数则负责生产batch。

import tensorflow as tf

def read_data(fileNameQue):

 reader = tf.TFRecordReader()
 key, value = reader.read(fileNameQue)
 features = tf.parse_single_example(value, features={'label': tf.FixedLenFeature([], tf.int64),
              'img': tf.FixedLenFeature([], tf.string),})
 img = tf.decode_raw(features["img"], tf.uint8)
 img = tf.reshape(img, [92,112]) # 恢复图像原始大小
 label = tf.cast(features["label"], tf.int32)

 return img, label

def batch_input(filename, batchSize):

 fileNameQue = tf.train.string_input_producer([filename], shuffle=True)
 img, label = read_data(fileNameQue) # fetch图像和label
 min_after_dequeue = 1000
 capacity = min_after_dequeue+3*batchSize
 # 预取图像和label并随机打乱,组成batch,此时tensor rank发生了变化,多了一个batch大小的维度
 exampleBatch,labelBatch = tf.train.shuffle_batch([img, label],batch_size=batchSize, capacity=capacity,
              min_after_dequeue=min_after_dequeue)
 return exampleBatch,labelBatch

if __name__ == "__main__":

 init = tf.initialize_all_variables()
 exampleBatch, labelBatch = batch_input("./data/faceTF.tfrecords", batchSize=10)

 with tf.Session() as sess:

  sess.run(init)
  coord = tf.train.Coordinator()
  threads = tf.train.start_queue_runners(coord=coord)

  for i in range(100):
   example, label = sess.run([exampleBatch, labelBatch])
   print(example.shape)

  coord.request_stop()
  coord.join(threads)

读取数据和解码数据与之前基本相同,针对不同格式数据集使用不同阅读器和解码器即可,后面是产生batch,核心是tf.train.shuffle_batch这个函数,它相当于一个蓄水池的功能,第一个参数代表蓄水池的入水口,也就是逐个读取到的记录,batch_size自然就是batch的大小了,capacity是蓄水池的容量,表示能容纳多少个样本,min_after_dequeue是指出队操作后还可以供随机采样出批量数据的样本池大小,显然,capacity要大于min_after_dequeue,官网推荐:min_after_dequeue + (num_threads + a small safety margin) * batch_size,还有一个参数就是num_threads,表示所用线程数目。

min_after_dequeue这个值越大,随机采样的效果越好,但是消耗的内存也越大。

以上这篇Tensorflow 实现分批量读取数据就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python私有属性和方法实例分析
Jan 15 Python
python获取一组汉字拼音首字母的方法
Jul 01 Python
高效测试用例组织算法pairwise之Python实现方法
Jul 19 Python
轻松实现TensorFlow微信跳一跳的AI
Jan 05 Python
Python实现使用卷积提取图片轮廓功能示例
May 12 Python
Python3.6+Django2.0以上 xadmin站点的配置和使用教程图解
Jun 04 Python
Django实现文件上传下载功能
Oct 06 Python
Python基础之变量基本用法与进阶详解
Jan 03 Python
Python使用xlrd实现读取合并单元格
Jul 09 Python
python ssh 执行shell命令的示例
Sep 29 Python
python实现学生通讯录管理系统
Feb 25 Python
AI:如何训练机器学习的模型
Apr 16 Python
Tensorflow的常用矩阵生成方式
Jan 04 #Python
Tensorflow读取并输出已保存模型的权重数值方式
Jan 04 #Python
tensorflow实现打印ckpt模型保存下的变量名称及变量值
Jan 04 #Python
tensorflow 获取所有variable或tensor的name示例
Jan 04 #Python
tensorflow没有output结点,存储成pb文件的例子
Jan 04 #Python
TensorFlow查看输入节点和输出节点名称方式
Jan 04 #Python
根据tensor的名字获取变量的值方式
Jan 04 #Python
You might like
PHP截断标题且兼容utf8和gb2312编码
2013/09/22 PHP
php实现mysql事务处理的方法
2014/12/25 PHP
PHP获取数组最大值下标的方法
2015/05/12 PHP
动态表单验证的操作方法和TP框架里面的ajax表单验证
2017/07/19 PHP
php使用scandir()函数扫描指定目录下所有文件示例
2019/06/08 PHP
Javascript 类、命名空间、代码组织代码
2011/07/31 Javascript
jquerymobile局部渲染的各种刷新方法小结
2014/03/05 Javascript
JQuery实现表格动态增加行并对新行添加事件
2014/07/30 Javascript
Jquery实现顶部弹出框特效
2015/08/08 Javascript
一不小心就做错的JS闭包面试题
2015/11/25 Javascript
javascript获取以及设置光标位置
2017/02/16 Javascript
Bootstrap3 多个模态对话框无法显示的解决方案
2017/02/23 Javascript
JS常见算法详解
2017/02/28 Javascript
实现单层json按照key字母顺序排序的示例
2017/12/06 Javascript
详解如何使用微信小程序云函数发送短信验证码
2019/03/13 Javascript
vant IndexBar实现的城市列表的示例代码
2019/11/20 Javascript
vue基于better-scroll仿京东分类列表
2020/06/30 Javascript
举例讲解Python中的list列表数据结构用法
2016/03/12 Python
用Python解决计数原理问题的方法
2016/08/04 Python
python绘制多个曲线的折线图
2020/03/23 Python
浅谈Python接口对json串的处理方法
2018/12/19 Python
Python中GeoJson和bokeh-1的使用讲解
2019/01/03 Python
Atom Python 配置Python3 解释器的方法
2019/08/28 Python
HTML5 CSS3打造相册效果附源码下载
2014/06/16 HTML / CSS
深入剖析HTML5 内联框架iFrame
2016/05/04 HTML / CSS
德国亚洲食品网上商店:asiafoodland.de
2019/12/28 全球购物
香港士多网上超级市场:Ztore
2021/01/09 全球购物
Burt’s Bees英国官网:世界领先的天然个人护理品牌
2020/08/17 全球购物
会话Bean的种类
2013/11/07 面试题
小学国庆节活动方案策划书
2014/09/16 职场文书
建筑技术负责人岗位职责
2015/04/13 职场文书
2015年英语教学工作总结
2015/05/25 职场文书
文艺节目主持词
2015/07/06 职场文书
祝福语集锦:送给闺蜜的生日祝福语
2019/10/08 职场文书
详解Python 3.10 中的新功能和变化
2021/04/28 Python
Django框架中视图的用法
2022/06/10 Python