我对PyTorch dataloader里的shuffle=True的理解


Posted in Python onMay 20, 2021

对shuffle=True的理解:

之前不了解shuffle的实际效果,假设有数据a,b,c,d,不知道batch_size=2后打乱,具体是如下哪一种情况:

1.先按顺序取batch,对batch内打乱,即先取a,b,a,b进行打乱;

2.先打乱,再取batch。

证明是第二种

shuffle (bool, optional): set to ``True`` to have the data reshuffled 
at every epoch (default: ``False``).
if shuffle:
    sampler = RandomSampler(dataset) #此时得到的是索引

补充:简单测试一下pytorch dataloader里的shuffle=True是如何工作的

看代码吧~

import sys
import torch
import random
import argparse
import numpy as np
import pandas as pd
import torch.nn as nn
from torch.nn import functional as F
from torch.optim import lr_scheduler
from torchvision import datasets, transforms
from torch.utils.data import TensorDataset, DataLoader, Dataset
 
class DealDataset(Dataset):
    def __init__(self):
        xy = np.loadtxt(open('./iris.csv','rb'), delimiter=',', dtype=np.float32)
        #data = pd.read_csv("iris.csv",header=None)
        #xy = data.values
        self.x_data = torch.from_numpy(xy[:, 0:-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])
        self.len = xy.shape[0]
    
    def __getitem__(self, index):
        return self.x_data[index], self.y_data[index]
 
    def __len__(self):
        return self.len
   
dealDataset = DealDataset() 
train_loader2 = DataLoader(dataset=dealDataset,
                          batch_size=2,
                          shuffle=True)
#print(dealDataset.x_data)
for i, data in enumerate(train_loader2):
    inputs, labels = data
 
    #inputs, labels = Variable(inputs), Variable(labels)
    print(inputs)
    #print("epoch:", epoch, "的第" , i, "个inputs", inputs.data.size(), "labels", labels.data.size())

简易数据集

我对PyTorch dataloader里的shuffle=True的理解我对PyTorch dataloader里的shuffle=True的理解

shuffle之后的结果,每次都是随机打乱,然后分成大小为n的若干个mini-batch.

我对PyTorch dataloader里的shuffle=True的理解

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
纯Python开发的nosql数据库CodernityDB介绍和使用实例
Oct 23 Python
Python3中常用的处理时间和实现定时任务的方法的介绍
Apr 07 Python
Python实现数据库编程方法详解
Jun 09 Python
在Django的模型中添加自定义方法的示例
Jul 21 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 Python
对Python w和w+权限的区别详解
Jan 23 Python
Python同步遍历多个列表的示例
Feb 19 Python
Python selenium爬取微信公众号文章代码详解
Aug 12 Python
Python爬虫使用bs4方法实现数据解析
Aug 25 Python
CocosCreator ScrollView优化系列之分帧加载
Apr 14 Python
Python制作春联的示例代码
Jan 22 Python
python+pytest接口自动化之token关联登录的实现
Apr 06 Python
Python快速优雅的批量修改Word文档样式
Django migrate报错的解决方案
Django使用channels + websocket打造在线聊天室
教你怎么用python爬取爱奇艺热门电影
Pytorch使用shuffle打乱数据的操作
May 20 #Python
教你利用Selenium+python自动化来解决pip使用异常
python 提取html文本的方法
May 20 #Python
You might like
PHP用GD库生成高质量的缩略图片
2011/03/09 PHP
浅析memcache启动以及telnet命令详解
2013/06/28 PHP
PHP生成随机密码方法汇总
2015/08/27 PHP
php array_values 返回数组的所有值详解及实例
2016/11/12 PHP
laravel 解决强制跳转 https的问题
2019/10/22 PHP
基于jquery的获取浏览器窗口大小的代码
2011/03/28 Javascript
js传参数受特殊字符影响错误的解决方法
2013/10/21 Javascript
通过$(this)使用jQuery包装后的方法或属性
2014/05/18 Javascript
jquery采用oop模式class类的使用示例
2016/01/22 Javascript
深入解析JavaScript框架Backbone.js中的事件机制
2016/02/14 Javascript
angular源码学习第一篇 setupModuleLoader方法
2016/10/20 Javascript
JavaScript基础之this详解
2017/06/04 Javascript
Vue如何实现组件的源码解析
2017/06/08 Javascript
Node.js+Express+MySql实现用户登录注册功能
2017/07/10 Javascript
浅谈HTTP 缓存的那些事儿
2018/10/17 Javascript
react组件从搭建脚手架到在npm发布的步骤实现
2019/01/09 Javascript
Bootstrap table 实现树形表格联动选中联动取消功能
2019/09/30 Javascript
vue cli3.0打包上线静态资源找不到路径的解决操作
2020/08/03 Javascript
Vue 集成 PDF.js 实现 PDF 预览和添加水印的步骤
2021/01/22 Vue.js
使用Pyrex来扩展和加速Python程序的教程
2015/04/13 Python
详解Python中的各种函数的使用
2015/05/24 Python
解决tensorflow模型参数保存和加载的问题
2018/07/26 Python
Python使用pickle模块储存对象操作示例
2018/08/15 Python
使用Scrapy爬取动态数据
2018/10/21 Python
python opencv 批量改变图片的尺寸大小的方法
2019/06/28 Python
python如何爬取网站数据并进行数据可视化
2019/07/08 Python
解决Python3用PIL的ImageFont输出中文乱码的问题
2019/08/22 Python
基于python纯函数实现井字棋游戏
2020/05/27 Python
Algenist奥杰尼官网:微藻抗衰老护肤品牌
2017/07/15 全球购物
巴西本土电商平台:Americanas
2020/06/21 全球购物
会务接待方案
2014/02/27 职场文书
服装店营销方案
2014/03/10 职场文书
毕业证委托书范文
2014/09/26 职场文书
2015年秋季运动会前导词
2015/07/20 职场文书
2016大一新生入学教育心得体会
2016/01/23 职场文书
写给消防战士们的一封慰问信
2019/10/07 职场文书