pytorch 把MNIST数据集转换成图片和txt的方法


Posted in Python onMay 20, 2018

本文介绍了pytorch 把MNIST数据集转换成图片和txt的方法,分享给大家,具体如下:

1.下载Mnist 数据集

import os
# third-party library
import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.utils.data as Data
import torchvision
import matplotlib.pyplot as plt 
# torch.manual_seed(1)  # reproducible
DOWNLOAD_MNIST = False
 
# Mnist digits dataset
if not(os.path.exists('./mnist/')) or not os.listdir('./mnist/'):
  # not mnist dir or mnist is empyt dir
  DOWNLOAD_MNIST = True
 
train_data = torchvision.datasets.MNIST(
  root='./mnist/',
  train=True,                   # this is training data
  transform=torchvision.transforms.ToTensor(),  # Converts a PIL.Image or numpy.ndarray to
                          # torch.FloatTensor of shape (C x H x W) and normalize in the range [0.0, 1.0]
  download=DOWNLOAD_MNIST,
)

下载下来的其实可以直接用了,但是我们这边想把它们转换成图片和txt,这样好看些,为后面用自己的图片和txt作为准备

2. 保存为图片和txt

import os
from skimage import io
import torchvision.datasets.mnist as mnist
import numpy 
root = "./mnist/raw/"
train_set = (
  mnist.read_image_file(os.path.join(root, 'train-images-idx3-ubyte')),
  mnist.read_label_file(os.path.join(root, 'train-labels-idx1-ubyte'))
)
 
test_set = (
  mnist.read_image_file(os.path.join(root,'t10k-images-idx3-ubyte')),
  mnist.read_label_file(os.path.join(root,'t10k-labels-idx1-ubyte'))
)
 
print("train set:", train_set[0].size())
print("test set:", test_set[0].size())
 
def convert_to_img(train=True):
  if(train):
    f = open(root + 'train.txt', 'w')
    data_path = root + '/train/'
    if(not os.path.exists(data_path)):
      os.makedirs(data_path)
    for i, (img, label) in enumerate(zip(train_set[0], train_set[1])):
      img_path = data_path + str(i) + '.jpg'
      io.imsave(img_path, img.numpy())
      int_label = str(label).replace('tensor(', '')
      int_label = int_label.replace(')', '')
      f.write(img_path + ' ' + str(int_label) + '\n')
    f.close()
  else:
    f = open(root + 'test.txt', 'w')
    data_path = root + '/test/'
    if (not os.path.exists(data_path)):
      os.makedirs(data_path)
    for i, (img, label) in enumerate(zip(test_set[0], test_set[1])):
      img_path = data_path + str(i) + '.jpg'
      io.imsave(img_path, img.numpy())
      int_label = str(label).replace('tensor(', '')
      int_label = int_label.replace(')', '')
      f.write(img_path + ' ' + str(int_label) + '\n')
    f.close()
 
convert_to_img(True)
convert_to_img(False)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python检测远程udp端口是否打开的方法
Mar 14 Python
python使用分治法实现求解最大值的方法
May 12 Python
Pycharm学习教程(2) 代码风格
May 02 Python
Python编程之基于概率论的分类方法:朴素贝叶斯
Nov 11 Python
python 使用值来排序一个字典的方法
Nov 16 Python
使用python itchat包爬取微信好友头像形成矩形头像集的方法
Feb 21 Python
Python多线程操作之互斥锁、递归锁、信号量、事件实例详解
Mar 24 Python
Django 允许局域网中的机器访问你的主机操作
May 13 Python
Python flask路由间传递变量实例详解
Jun 03 Python
Python生成器传参数及返回值原理解析
Jul 22 Python
python实现三阶魔方还原的示例代码
Apr 28 Python
深入理解python协程
Jun 15 Python
Python安装lz4-0.10.1遇到的坑
May 20 #Python
Python requests发送post请求的一些疑点
May 20 #Python
python中virtualenvwrapper安装与使用
May 20 #Python
django静态文件加载的方法
May 20 #Python
django中静态文件配置static的方法
May 20 #Python
Python中跳台阶、变态跳台阶与矩形覆盖问题的解决方法
May 19 #Python
Python利用公共键如何对字典列表进行排序详解
May 19 #Python
You might like
PHP调用JAVA的WebService简单实例
2014/03/11 PHP
linux下安装php的memcached客户端
2014/08/03 PHP
Thinkphp中的curd应用实用要点
2015/01/04 PHP
php使用Jpgraph绘制复杂X-Y坐标图的方法
2015/06/10 PHP
php中json_encode不兼容JSON_UNESCAPED_UNICODE的解决方案
2016/05/31 PHP
PHP开发实现快递查询功能详解
2019/04/08 PHP
Javascript学习笔记之 对象篇(一) : 对象的使用和属性
2014/06/24 Javascript
轻松创建nodejs服务器(5):事件处理程序
2014/12/18 NodeJs
Bootstrap常用组件学习(整理)
2017/03/24 Javascript
three.js中文文档学习之通过模块导入
2017/11/20 Javascript
解决Angular.js中使用Swiper插件不能滑动的问题
2018/02/26 Javascript
vue devtools的安装与使用教程
2018/08/08 Javascript
移动端H5页面返回并刷新页面(BFcache)的方法
2018/11/06 Javascript
快速解决layui弹窗按enter键不停弹窗的问题
2019/09/18 Javascript
vue使用swiper实现中间大两边小的轮播图效果
2019/11/24 Javascript
浅谈numpy库的常用基本操作方法
2018/01/09 Python
Python实现判断并移除列表指定位置元素的方法
2018/04/13 Python
python爬虫的一个常见简单js反爬详解
2019/07/09 Python
Python Pandas对缺失值的处理方法
2019/09/27 Python
pandas实现将日期转换成timestamp
2019/12/07 Python
python中slice参数过长的处理方法及实例
2020/12/15 Python
你不知道的5个HTML5新功能
2016/06/28 HTML / CSS
戴尔美国官网:Dell
2016/08/31 全球购物
怎么处理XML的中文问题
2015/03/26 面试题
什么是组件架构
2016/05/15 面试题
护理自荐信
2013/10/22 职场文书
数控个人求职信范文
2014/02/03 职场文书
合作经营协议书
2014/04/17 职场文书
优秀驾驶员先进事迹材料
2014/05/04 职场文书
户籍证明书标准模板
2014/09/10 职场文书
公务员群众路线心得体会
2014/11/03 职场文书
分居协议书范本(律师见证版)
2014/11/26 职场文书
如何制定一份可行的计划!
2019/06/21 职场文书
SpringBoot整合MongoDB的实现步骤
2021/06/23 MongoDB
MySQL派生表联表查询实战过程
2022/03/20 MySQL
Win11如何默认打开软件界面最大化?Win11默认打开软件界面最大化的方法
2022/07/15 数码科技