编程 Python

python实现将两个文件夹合并至另一个文件夹(制作数据集)

Posted in Python onApril 03, 2020

此操作目的是为了制作自己的数据集，深度学习框架进行数据准备，此操作步骤包括对文件夹进行操作，将两个文件夹合并至另一个文件夹

该实例为一个煤矿工人脸识别的案例;首先原始数据集（简化版的数据集旨在说明数据准备过程）如下图所示：

该数据集只有三个人的数据，A01代表工人甲的煤矿下的照片，B01代表工人甲下矿前的照片，同理A02、B02代表工人乙的矿下、矿上的照片数据。。。

如下图所示

python实现将两个文件夹合并至另一个文件夹(制作数据集)

矿下

python实现将两个文件夹合并至另一个文件夹(制作数据集)

矿上

python实现将两个文件夹合并至另一个文件夹(制作数据集)

开始制作数据集：

首先建立训练集（0.7）和测试集（0.3），即建立一个空白文件夹

python实现将两个文件夹合并至另一个文件夹(制作数据集)

将该文件夹分为四个小文件夹（空），train代表训练集，val代表测试集，valb代表矿井下的测试集，vall代表矿井上的测试集，注：后边两个测试集可有可无

最终制作的数据集如下所示：

python实现将两个文件夹合并至另一个文件夹(制作数据集)

下面为所有的程序详解

#导入一些进行该操作需要的库
import numpy as np
import os
import random
import shutil

path=r'C:\Users\Administrator.SKY-20180518VHY\Desktop\rx\ore'#原始数据集的路径
data=os.listdir(path)
#listdir该操作（[添加链接描述](https://3water.com/article/184106.htm)）在我的上篇文章中有所介绍，此操作能读取的内容为A01、A02、A03、B01、B02、B03这些文件夹
#print(data)

root=path#复制原始数据路径path

读取文件夹 A01、A02、A03、存入c列表中B01、B02、B03，将其存入d列表中

c=[]
d=[]#创建两个空列表
for i in range(len(data)):
 a=data[i][0]
 if (a=='A'):
  c.append(data[i])
 else:
  d.append(data[i])
#print(d)

python实现将两个文件夹合并至另一个文件夹(制作数据集)

导入路径四个空文件夹的路径

train_root='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\train'
val_root='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\val'
vall_root='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\valb'
valb_root='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\vall'


for i in range(len(c)):
 qqq=os.path.exists(train_root+'/'+c[i][1:])
 if (not qqq):
  os.mkdir(train_root+'/'+c[i][1:])
  qq=os.path.exists(val_root+'/'+c[i][1:])
  if (not qq):
   os.mkdir(val_root+'/'+c[i][1:])
   qq=os.path.exists(vall_root+'/'+c[i][1:])
   if (not qq):
    os.mkdir(vall_root+'/'+c[i][1:])
    qq=os.path.exists(valb_root+'/'+c[i][1:])
    if (not qq):
     os.mkdir(valb_root+'/'+c[i][1:])
#f=[]
#g=[]
aq='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\rx\\ore\\'
train_root1='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\train\\'
val_root1='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\val\\'
vall_root1='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\valb\\'
valb_root1='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\myself\\vall\\'
for i in range(len(c)):
 a=c[i]
 data_0=os.listdir(aq+a)
# f.append(data_0)
# g.append(aq+a)
#print(f)
#print(g) 
 random.shuffle(data_0)#打乱A中数据
 for j in range(len(d)):
  b=d[j]
  if(a[1:]==b[1:]):
   data_1=os.listdir(aq+b)
   #print(aq+b);
   random.shuffle(data_1)
   #print(data_1)
   #print(data_0,data_1)
   for z in range(len(data_0)):
    #print(z)
    pic_path=aq+a+'/'+data_0[z]
    
    if z<int(len(data_0)*0.7):
     obj_path=train_root1+a[1:]+'/'+data_0[z]
     
    else:
     obj_path=val_root1+a[1:]+'/'+data_0[z]
     obl_path=vall_root1+a[1:]+'/'+data_0[z]
     shutil.copyfile(pic_path,obl_path)
   #print(len(data_0),len(data_0)*0.7)
    #if (os.path.exists(pic_path)):
    shutil.copyfile(pic_path,obj_path)
   for z in range(len(data_1)):
    pic_path=aq+b+'/'+data_1[z]
    if z<int(len(data_1)*0.7):
     obj_path=train_root1+b[1:]+'/'+data_1[z]
     
    else:
     obj_path=val_root1+b[1:]+'/'+data_1[z]
     obl_path=valb_root1+a[1:]+'/'+data_1[z]
     shutil.copyfile(pic_path,obl_path)
    #if (os.path.exists(pic_path)):
    shutil.copyfile(pic_path,obj_path)#shutil.copyfile( src, dst)

从源src复制到dst中去。当然前提是目标地址是具备可写权限。抛出的异常信息为IOException. 如果当前的dst已存在的话就会被覆盖掉

将数据送入pytorch中，对数据进行迭代

from __future__ import print_function, division
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import os
import copy
import math
import torch.nn.functional as F

D=299

data_transforms = {
 'train': transforms.Compose([
#  transforms.RandomResizedCrop(D),
  transforms.Resize(D),
  transforms.RandomCrop(D),
  transforms.RandomHorizontalFlip(),
  transforms.ToTensor(),
  transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
 ]),
 'val': transforms.Compose([
  transforms.Resize(D),
  transforms.CenterCrop(D),
  transforms.ToTensor(),
  transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
 ]),
}

data_dir = r'C:\Users\Administrator.SKY-20180518VHY\Desktop\myself'
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x),
           data_transforms[x])
     for x in ['train', 'val']}
dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=200,
            shuffle=True, num_workers=4)
    for x in ['train', 'val']}
dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']}
class_names = image_datasets['train'].classes

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
#print(image_datasets['train'][0])
img, label = image_datasets['val'][11] 
print(label)#输出为2即第三类

以上这篇python实现将两个文件夹合并至另一个文件夹(制作数据集)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

python实现将两个文件夹合并至另一个文件夹(制作数据集)

- Author -

朴素.无恙

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python socket C/S结构的聊天室应用实现

Nov 30 Python

Python中for循环控制语句用法实例

Jun 02 Python

Django与遗留的数据库整合的方法指南

Jul 24 Python

Windows系统下使用flup搭建Nginx和Python环境的方法

Dec 25 Python

python使用pymysql实现操作mysql

Sep 13 Python

python将unicode转为str的方法

Jun 21 Python

Python实现将字符串的首字母变为大写,其余都变为小写的方法

Jun 11 Python

Python实现个人微信号自动监控告警的示例

Jul 03 Python

Python计算两个矩形重合面积代码实例

Sep 16 Python

Pycharm 字体大小调整设置的方法实现

Sep 27 Python

python psutil监控进程实例

Dec 17 Python

Python学习工具jupyter notebook安装及用法解析

Oct 23 Python

pycharm安装及如何导入numpy

Apr 03 #Python

解决pyPdf和pyPdf2在合并pdf时出现异常的问题

Apr 03 #Python

Python利用PyPDF2库获取PDF文件总页码实例

Apr 03 #Python

Numpy 理解ndarray对象的示例代码

Apr 03 #Python

python计算Content-MD5并获取文件的Content-MD5值方式

Apr 03 #Python

Django自定义列表 models字段显示方式

Apr 03 #Python

使用Django清空数据库并重新生成

Apr 03 #Python

You might like

PHP中调用JAVA

2006/10/09 PHP

php图片处理：加水印、缩略图的实现（自定义函数：watermark、thumbnail）

2010/12/02 PHP

PHP 7.1新特性的汇总介绍

2016/12/16 PHP

PHP 进度条函数的简单实例

2017/09/19 PHP

php tpl模板引擎定义与使用示例

2019/08/09 PHP

(跨浏览器基础事件/浏览器检测/判断浏览器)经验代码分享

2013/01/24 Javascript

jquery.cookie() 方法的使用(读取、写入、删除)

2013/12/05 Javascript

js 通用订单代码

2013/12/23 Javascript

node.js中的fs.ftruncate方法使用说明

2014/12/15 Javascript

js实现圆盘记速表

2015/08/03 Javascript

Bootstrap简单表单显示学习笔记

2016/11/15 Javascript

Javascript中字符串replace方法的第二个参数探究

2016/12/05 Javascript

hovertree插件实现二级树形菜单（简单实用）

2016/12/28 Javascript

Vue全局分页组件的实现代码

2018/08/10 Javascript

AngularJS修改model值时,显示内容不变的实例

2018/09/13 Javascript

详解几十行代码实现一个vue的状态管理

2019/01/28 Javascript

详解JS浏览器事件循环机制

2019/03/27 Javascript

[02:56]DOTA2矮人直升机英雄基础教程

2013/11/26 DOTA

[02:22]完美世界DOTA2联赛PWL S3 集锦第一期

2020/12/15 DOTA

Python实现队列的方法

2015/05/26 Python

python+pygame简单画板实现代码实例

2017/12/13 Python

python使用json序列化datetime类型实例解析

2018/02/11 Python

Mytheresa中国官网：德国时尚奢侈品商城

2017/08/04 全球购物

英国老牌潮鞋店：Offspring

2019/08/19 全球购物

Skyscanner新西兰：全球领先的旅游搜索网站

2019/08/26 全球购物

全球性的众包图形设计市场：DesignCrowd

2021/02/02 全球购物

抽象类和接口的区别

2012/09/19 面试题

施工人员岗位职责

2013/12/12 职场文书

小学生新学期寄语

2014/01/19 职场文书

业务总经理岗位职责

2014/02/03 职场文书

个人三严三实对照检查材料

2014/09/25 职场文书

求职自荐信范文（优秀篇）

2015/03/27 职场文书

停电调休通知

2015/04/16 职场文书

消费者理赔投诉书

2015/07/02 职场文书

浅谈python中的多态

2021/06/15 Python

vue实现简易音乐播放器

2022/08/14 Vue.js