编程 Python

pytorch随机采样操作SubsetRandomSampler()

Posted in Python onJuly 07, 2020

这篇文章记录一个采样器都随机地从原始的数据集中抽样数据。抽样数据采用permutation。生成任意一个下标重排，从而利用下标来提取dataset中的数据的方法

需要的库

import torch

使用方法

这里以MNIST举例

train_dataset = dsets.MNIST(root='./data', #文件存放路径
              train=True,  #提取训练集
              transform=transforms.ToTensor(), #将图像转化为Tensor
              download=True)

sample_size = len(train_dataset)
sampler1 = torch.utils.data.sampler.SubsetRandomSampler(
  np.random.choice(range(len(train_dataset)), sample_size))

代码详解

np.random.choice()

#numpy.random.choice(a, size=None, replace=True, p=None)
#从a(只要是ndarray都可以，但必须是一维的)中随机抽取数字，并组成指定大小(size)的数组
#replace:True表示可以取相同数字，False表示不可以取相同数字
#数组p：与数组a相对应，表示取数组a中每个元素的概率，默认为选取每个元素的概率相同。

那么这里就相当于抽取了一个全排列

torch.utils.data.sampler.SubsetRandomSampler

# 会根据后面给的列表从数据集中按照下标取元素
# class torch.utils.data.SubsetRandomSampler(indices)：无放回地按照给定的索引列表采样样本元素。

所以就可以了。

补充知识：Pytorch学习之torch----随机抽样、序列化、并行化

1. torch.manual_seed(seed)

说明：设置生成随机数的种子，返回一个torch._C.Generator对象。使用随机数种子之后，生成的随机数是相同的。

参数：

seed(int or long) -- 种子

>>> import torch
>>> torch.manual_seed(1)
<torch._C.Generator object at 0x0000019684586350>
>>> a = torch.rand(2, 3)
>>> a
tensor([[0.7576, 0.2793, 0.4031],
    [0.7347, 0.0293, 0.7999]])
>>> torch.manual_seed(1)
<torch._C.Generator object at 0x0000019684586350>
>>> b = torch.rand(2, 3)
>>> b
tensor([[0.7576, 0.2793, 0.4031],
    [0.7347, 0.0293, 0.7999]])
>>> a == b
tensor([[1, 1, 1],
    [1, 1, 1]], dtype=torch.uint8)

2. torch.initial_seed()

说明：返回生成随机数的原始种子值

>>> torch.manual_seed(4)
<torch._C.Generator object at 0x0000019684586350>
>>> torch.initial_seed()
4

3. torch.get_rng_state()

说明：返回随机生成器状态(ByteTensor)

>>> torch.initial_seed()
4
>>> torch.get_rng_state()
tensor([4, 0, 0, ..., 0, 0, 0], dtype=torch.uint8)

4. torch.set_rng_state()

说明：设定随机生成器状态

参数：

new_state(ByteTensor) -- 期望的状态

5. torch.default_generator

说明：默认的随机生成器。等于<torch._C.Generator object>

6. torch.bernoulli(input, out=None)

说明：从伯努利分布中抽取二元随机数(0或1)。输入张量包含用于抽取二元值的概率。因此，输入中的所有值都必须在[0,1]区间内。输出张量的第i个元素值，将会以输入张量的第i个概率值等于1。返回值将会是与输入相同大小的张量，每个值为0或者1.

参数：

input(Tensor) -- 输入为伯努利分布的概率值

out(Tensor,可选) -- 输出张量

>>> a = torch.Tensor(3, 3).uniform_(0, 1)
>>> a
tensor([[0.5596, 0.5591, 0.0915],
    [0.2100, 0.0072, 0.0390],
    [0.9929, 0.9131, 0.6186]])
>>> torch.bernoulli(a)
tensor([[0., 1., 0.],
    [0., 0., 0.],
    [1., 1., 1.]])

7. torch.multinomial(input, num_samples, replacement=False, out=None)

说明：返回一个张量，每行包含从input相应行中定义的多项分布中抽取的num_samples个样本。要求输入input每行的值不需要总和为1，但是必须非负且总和不能为0。当抽取样本时，依次从左到右排列(第一个样本对应第一列)。如果输入input是一个向量，输出out也是一个相同长度num_samples的向量。如果输入input是m行的矩阵，输出out是形如m x n的矩阵。并且如果参数replacement为True，则样本抽取可以重复。否则，一个样本在每行不能被重复。

参数：

input(Tensor) -- 包含概率的张量

num_samples(int) -- 抽取的样本数

replacement(bool) -- 布尔值，决定是否能重复抽取

out(Tensor) -- 结果张量

>>> weights = torch.Tensor([0, 10, 3, 0])
>>> weights
tensor([ 0., 10., 3., 0.])
>>> torch.multinomial(weights, 4, replacement=True)
tensor([1, 1, 1, 1])

8. torch.normal(means, std, out=None)

说明：返回一个张量，包含从给定参数means，std的离散正态分布中抽取随机数。均值means是一个张量，包含每个输出元素相关的正态分布的均值。std是一个张量。包含每个输出元素相关的正态分布的标准差。均值和标准差的形状不须匹配，但每个张量的元素个数必须想听。

参数：

means(Tensor) -- 均值

std(Tensor) -- 标准差

out(Tensor) -- 输出张量

>>> n_data = torch.ones(5, 2)
>>> n_data
tensor([[1., 1.],
    [1., 1.],
    [1., 1.],
    [1., 1.],
    [1., 1.]])
>>> x0 = torch.normal(2 * n_data, 1)
>>> x0
tensor([[1.6544, 0.9805],
    [2.1114, 2.7113],
    [1.0646, 1.9675],
    [2.7652, 3.2138],
    [1.1204, 2.0293]])

9. torch.save(obj, f, pickle_module=<module 'pickle' from '/home/lzjs/...)

说明：保存一个对象到一个硬盘文件上。

参数：

obj -- 保存对象

f -- 类文件对象或一个保存文件名的字符串

pickle_module -- 用于pickling源数据和对象的模块

pickle_protocol -- 指定pickle protocal可以覆盖默认参数

10. torch.load(f, map_location=None, pickle_module=<module 'pickle' from '/home/lzjs/...)

说明：从磁盘文件中读取一个通过torch.save()保存的对象。torch.load()可通过参数map_location动态地进行内存重映射，使其能从不动设备中读取文件。一般调用时，需两个参数：storage和location tag。返回不同地址中的storage，或者返回None。如果这个参数是字典的话，意味着从文件的地址标记到当前系统的地址标记的映射。

参数：

f -- l类文件对象或一个保存文件名的字符串

map_location -- 一个函数或字典规定如何remap存储位置

pickle_module -- 用于unpickling元数据和对象的模块

torch.load('tensors.pt')
# 加载所有的张量到CPU
torch.load('tensor.pt', map_location=lambda storage, loc:storage)
# 加载张量到GPU
torch.load('tensors.pt', map_location={'cuda:1':'cuda:0'})

11. torch.get_num_threads()

说明：获得用于并行化CPU操作的OpenMP线程数

12. torch.set_num_threads()

说明：设定用于并行化CPU操作的OpenMP线程数

以上这篇pytorch随机采样操作SubsetRandomSampler()就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

pytorch随机采样操作SubsetRandomSampler()

- Author -

tsz danger

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python数据类型_字符串常用操作(详解)

May 30 Python

浅谈python中列表、字符串、字典的常用操作

Sep 19 Python

Django重装mysql后启动报错：No module named ‘MySQLdb’的解决方法

Apr 22 Python

python numpy和list查询其中某个数的个数及定位方法

Jun 27 Python

Win10下python 2.7.13 安装配置方法图文教程

Sep 18 Python

在python里面运用多继承方法详解

Jul 01 Python

django多个APP的urls设置方法(views重复问题解决)

Jul 19 Python

详细介绍pandas的DataFrame的append方法使用

Jul 31 Python

python求质数列表的例子

Nov 24 Python

Python二次规划和线性规划使用实例

Dec 09 Python

通过代码实例解析Pytest运行流程

Aug 20 Python

Python word文本自动化操作实现方法解析

Nov 05 Python

pytorch加载自己的图像数据集实例

Jul 07 #Python

keras实现VGG16 CIFAR10数据集方式

Jul 07 #Python

使用darknet框架的imagenet数据分类预训练操作

Jul 07 #Python

Python调用C语言程序方法解析

Jul 07 #Python

keras实现VGG16方式(预测一张图片)

Jul 07 #Python

通过实例解析Python RPC实现原理及方法

Jul 07 #Python

Keras预训练的ImageNet模型实现分类操作

Jul 07 #Python

You might like

PHILIPS D1835/D1875的电路分析与打理

2021/03/02 无线电

PHP学习笔记之一

2011/01/17 PHP

PHP判断用户是否已经登录（跳转到不同页面或者执行不同动作）

2016/09/22 PHP

浅谈php中的循环while、do...while、for、foreach四种循环

2016/11/05 PHP

总结的一些PHP开发中的tips(必看篇)

2017/03/24 PHP

JavaScript与DOM组合动态创建表格实例

2012/12/23 Javascript

javascrip关于继承的小例子

2013/05/10 Javascript

Javascript获取当前时间函数和时间操作小结

2014/10/01 Javascript

了不起的node.js读书笔记之node.js中的特性

2014/12/22 Javascript

JS+CSS实现经典的左侧竖向滑动菜单效果

2015/09/23 Javascript

Nodejs express框架一个工程中同时使用ejs模版和jade模版

2015/12/28 NodeJs

jQuery学习心得总结(必看篇)

2016/06/10 Javascript

简单实现jquery焦点图

2016/12/12 Javascript

nodejs搭建本地服务器并访问文件的方法

2017/03/03 NodeJs

Vue项目分环境打包的实现步骤

2018/04/02 Javascript

总结4个方面优化Vue项目

2019/02/11 Javascript

JavaScript实现移动端弹窗后禁止滚动

2020/05/25 Javascript

浅谈Python实现2种文件复制的方法

2018/01/19 Python

Python-ElasticSearch搜索查询的讲解

2019/02/25 Python

postman模拟访问具有Session的post请求方法

2019/07/15 Python

python画蝴蝶曲线图的实例

2019/11/21 Python

ivx平台开发之不用代码实现一个九宫格抽奖功能

2021/01/27 HTML / CSS

部队学习十八大感言

2014/01/11 职场文书

四好少年事迹材料

2014/01/12 职场文书

英语感恩演讲稿

2014/01/14 职场文书

学习全国两会精神心得体会范文

2014/03/17 职场文书

年会搞笑主持词串词

2014/03/24 职场文书

2014年巴西世界杯口号

2014/06/05 职场文书

工作态度不端正检讨书

2014/10/04 职场文书

缓刑期间思想汇报范文

2014/10/10 职场文书

实习单位推荐信

2015/03/27 职场文书

刑事案件上诉状

2015/05/23 职场文书

教师学习十八届五中全会精神心得体会

2016/01/05 职场文书

又涨知识了，自律到底多重要？

2019/06/27 职场文书

电子表的操作介绍说明书

2019/10/28 职场文书

Pytest allure 命令行参数的使用

2021/04/18 Python