Tensorflow 实现分批量读取数据


Posted in Python onJanuary 04, 2020

之前的博客里使用tf读取数据都是每次fetch一条记录,实际上大部分时候需要fetch到一个batch的小批量数据,在tf中这一操作的明显变化就是tensor的rank发生了变化,我目前使用的人脸数据集是灰度图像,因此大小是92*112的,所以最开始fetch拿到的图像数据集经过reshape之后就是一个rank为2的tensor,大小是92*112的(如果考虑通道,也可以reshape为rank为3的,即92*112*1)。

如果加入batch,比如batch大小为5,那么拿到的tensor的rank就变成了3,大小为5*92*112。

下面规则化的写一下读取数据的一般流程,按照官网的实例,一般把读取数据拆分成两个大部分,一个是函数专门负责读取数据和解码数据,一个函数则负责生产batch。

import tensorflow as tf

def read_data(fileNameQue):

 reader = tf.TFRecordReader()
 key, value = reader.read(fileNameQue)
 features = tf.parse_single_example(value, features={'label': tf.FixedLenFeature([], tf.int64),
              'img': tf.FixedLenFeature([], tf.string),})
 img = tf.decode_raw(features["img"], tf.uint8)
 img = tf.reshape(img, [92,112]) # 恢复图像原始大小
 label = tf.cast(features["label"], tf.int32)

 return img, label

def batch_input(filename, batchSize):

 fileNameQue = tf.train.string_input_producer([filename], shuffle=True)
 img, label = read_data(fileNameQue) # fetch图像和label
 min_after_dequeue = 1000
 capacity = min_after_dequeue+3*batchSize
 # 预取图像和label并随机打乱,组成batch,此时tensor rank发生了变化,多了一个batch大小的维度
 exampleBatch,labelBatch = tf.train.shuffle_batch([img, label],batch_size=batchSize, capacity=capacity,
              min_after_dequeue=min_after_dequeue)
 return exampleBatch,labelBatch

if __name__ == "__main__":

 init = tf.initialize_all_variables()
 exampleBatch, labelBatch = batch_input("./data/faceTF.tfrecords", batchSize=10)

 with tf.Session() as sess:

  sess.run(init)
  coord = tf.train.Coordinator()
  threads = tf.train.start_queue_runners(coord=coord)

  for i in range(100):
   example, label = sess.run([exampleBatch, labelBatch])
   print(example.shape)

  coord.request_stop()
  coord.join(threads)

读取数据和解码数据与之前基本相同,针对不同格式数据集使用不同阅读器和解码器即可,后面是产生batch,核心是tf.train.shuffle_batch这个函数,它相当于一个蓄水池的功能,第一个参数代表蓄水池的入水口,也就是逐个读取到的记录,batch_size自然就是batch的大小了,capacity是蓄水池的容量,表示能容纳多少个样本,min_after_dequeue是指出队操作后还可以供随机采样出批量数据的样本池大小,显然,capacity要大于min_after_dequeue,官网推荐:min_after_dequeue + (num_threads + a small safety margin) * batch_size,还有一个参数就是num_threads,表示所用线程数目。

min_after_dequeue这个值越大,随机采样的效果越好,但是消耗的内存也越大。

以上这篇Tensorflow 实现分批量读取数据就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python爬取三国演义的实现方法
Sep 12 Python
Python之web模板应用
Dec 26 Python
python装饰器-限制函数调用次数的方法(10s调用一次)
Apr 21 Python
Python3读取Excel数据存入MySQL的方法
May 04 Python
详解Python3.6的py文件打包生成exe
Jul 13 Python
Python OpenCV之图片缩放的实现(cv2.resize)
Jun 28 Python
django 基于中间件实现限制ip频繁访问过程详解
Jul 30 Python
浅谈cv2.imread()和keras.preprocessing中的image.load_img()区别
Jun 12 Python
深入浅析Python代码规范性检测
Jul 31 Python
Python中random模块常用方法的使用教程
Oct 04 Python
Python竟然能剪辑视频
May 25 Python
如何利用pygame实现打飞机小游戏
May 30 Python
Tensorflow的常用矩阵生成方式
Jan 04 #Python
Tensorflow读取并输出已保存模型的权重数值方式
Jan 04 #Python
tensorflow实现打印ckpt模型保存下的变量名称及变量值
Jan 04 #Python
tensorflow 获取所有variable或tensor的name示例
Jan 04 #Python
tensorflow没有output结点,存储成pb文件的例子
Jan 04 #Python
TensorFlow查看输入节点和输出节点名称方式
Jan 04 #Python
根据tensor的名字获取变量的值方式
Jan 04 #Python
You might like
全国FM电台频率大全 - 6 辽宁省
2020/03/11 无线电
扩展你的 PHP 之入门篇
2006/12/04 PHP
测试php连接mysql是否成功的代码分享
2014/01/24 PHP
PHP中让curl支持sock5的代码实例
2015/01/21 PHP
ThinkPHP模板标签eq if 中区分0,null,false的方法
2017/03/24 PHP
Windows下wamp php单元测试工具PHPUnit安装及生成日志文件配置方法
2018/05/28 PHP
php生成静态页面并实现预览功能
2019/06/27 PHP
总结一些js自定义的函数
2006/08/05 Javascript
js 获取元素下面所有li的两种方法
2014/04/14 Javascript
jquery 3D 标签云示例代码
2014/06/12 Javascript
解析JavaScript模仿块级作用域
2016/12/29 Javascript
nodejs中解决异步嵌套循环和循环嵌套异步的问题
2017/07/12 NodeJs
react以create-react-app为基础创建项目
2018/03/14 Javascript
解决nodejs的npm命令无反应的问题
2018/05/17 NodeJs
详解基于vue的服务端渲染框架NUXT
2018/06/20 Javascript
JS实现简易留言板特效
2019/12/23 Javascript
vue实现购物车加减
2020/05/30 Javascript
Python的Flask框架中实现登录用户的个人资料和头像的教程
2015/04/20 Python
利用PyInstaller将python程序.py转为.exe的方法详解
2017/05/03 Python
Python实现的科学计算器功能示例
2017/08/04 Python
Python+request+unittest实现接口测试框架集成实例
2018/03/16 Python
python如何读写json数据
2018/03/21 Python
Python给定一个句子倒序输出单词以及字母的方法
2018/12/20 Python
Django框架orM与自定义SQL语句混合事务控制操作
2019/06/27 Python
python、Matlab求定积分的实现
2019/11/20 Python
python global和nonlocal用法解析
2020/02/03 Python
使用Python pip怎么升级pip
2020/08/11 Python
python 字符串格式化的示例
2020/09/21 Python
Python读取图像并显示灰度图的实现
2020/12/01 Python
英国一家专门出售品牌鞋子的网站:Allsole
2016/08/07 全球购物
英国最大的婴儿监视器网上商店:Baby Monitors Direct
2018/04/24 全球购物
威盛公司软件C++工程师笔试题面试题
2012/07/16 面试题
酒店个人培训自我鉴定
2013/12/11 职场文书
客户服务经理岗位职责
2014/01/29 职场文书
商务代表岗位职责
2015/02/15 职场文书
大学生见习总结报告
2015/06/24 职场文书