编程 Python

Pytorch实现WGAN用于动漫头像生成

Posted in Python onMarch 04, 2021

WGAN与GAN的不同

去除sigmoid
使用具有动量的优化方法，比如使用RMSProp
要对Discriminator的权重做修整限制以确保lipschitz连续约

WGAN实战卷积生成动漫头像

import torch
import torch.nn as nn
import torchvision.transforms as transforms
from torch.utils.data import DataLoader
from torchvision.utils import save_image
import os
from anime_face_generator.dataset import ImageDataset
 
batch_size = 32
num_epoch = 100
z_dimension = 100
dir_path = './wgan_img'
 
# 创建文件夹
if not os.path.exists(dir_path):
  os.mkdir(dir_path)
 
 
def to_img(x):
  """因为我们在生成器里面用了tanh"""
  out = 0.5 * (x + 1)
  return out
 
 
dataset = ImageDataset()
dataloader = DataLoader(dataset, batch_size=32, shuffle=False)
 
 
class Generator(nn.Module):
  def __init__(self):
    super().__init__()
 
    self.gen = nn.Sequential(
      # 输入是一个nz维度的噪声，我们可以认为它是一个1*1*nz的feature map
      nn.ConvTranspose2d(100, 512, 4, 1, 0, bias=False),
      nn.BatchNorm2d(512),
      nn.ReLU(True),
      # 上一步的输出形状：(512) x 4 x 4
      nn.ConvTranspose2d(512, 256, 4, 2, 1, bias=False),
      nn.BatchNorm2d(256),
      nn.ReLU(True),
      # 上一步的输出形状： (256) x 8 x 8
      nn.ConvTranspose2d(256, 128, 4, 2, 1, bias=False),
      nn.BatchNorm2d(128),
      nn.ReLU(True),
      # 上一步的输出形状： (256) x 16 x 16
      nn.ConvTranspose2d(128, 64, 4, 2, 1, bias=False),
      nn.BatchNorm2d(64),
      nn.ReLU(True),
      # 上一步的输出形状：(256) x 32 x 32
      nn.ConvTranspose2d(64, 3, 5, 3, 1, bias=False),
      nn.Tanh() # 输出范围 -1~1 故而采用Tanh
      # nn.Sigmoid()
      # 输出形状：3 x 96 x 96
    )
 
  def forward(self, x):
    x = self.gen(x)
    return x
 
  def weight_init(m):
    # weight_initialization: important for wgan
    class_name = m.__class__.__name__
    if class_name.find('Conv') != -1:
      m.weight.data.normal_(0, 0.02)
    elif class_name.find('Norm') != -1:
      m.weight.data.normal_(1.0, 0.02)
 
 
class Discriminator(nn.Module):
  def __init__(self):
    super().__init__()
    self.dis = nn.Sequential(
      nn.Conv2d(3, 64, 5, 3, 1, bias=False),
      nn.LeakyReLU(0.2, inplace=True),
      # 输出 (64) x 32 x 32
 
      nn.Conv2d(64, 128, 4, 2, 1, bias=False),
      nn.BatchNorm2d(128),
      nn.LeakyReLU(0.2, inplace=True),
      # 输出 (128) x 16 x 16
 
      nn.Conv2d(128, 256, 4, 2, 1, bias=False),
      nn.BatchNorm2d(256),
      nn.LeakyReLU(0.2, inplace=True),
      # 输出 (256) x 8 x 8
 
      nn.Conv2d(256, 512, 4, 2, 1, bias=False),
      nn.BatchNorm2d(512),
      nn.LeakyReLU(0.2, inplace=True),
      # 输出 (512) x 4 x 4
 
      nn.Conv2d(512, 1, 4, 1, 0, bias=False),
      nn.Flatten(),
      # nn.Sigmoid() # 输出一个数(概率)
    )
 
  def forward(self, x):
    x = self.dis(x)
    return x
 
  def weight_init(m):
    # weight_initialization: important for wgan
    class_name = m.__class__.__name__
    if class_name.find('Conv') != -1:
      m.weight.data.normal_(0, 0.02)
    elif class_name.find('Norm') != -1:
      m.weight.data.normal_(1.0, 0.02)
 
 
def save(model, filename="model.pt", out_dir="out/"):
  if model is not None:
    if not os.path.exists(out_dir):
      os.mkdir(out_dir)
    torch.save({'model': model.state_dict()}, out_dir + filename)
  else:
    print("[ERROR]:Please build a model!!!")
 
 
import QuickModelBuilder as builder
 
if __name__ == '__main__':
  one = torch.FloatTensor([1]).cuda()
  mone = -1 * one
 
  is_print = True
  # 创建对象
  D = Discriminator()
  G = Generator()
  D.weight_init()
  G.weight_init()
 
  if torch.cuda.is_available():
    D = D.cuda()
    G = G.cuda()
 
  lr = 2e-4
  d_optimizer = torch.optim.RMSprop(D.parameters(), lr=lr, )
  g_optimizer = torch.optim.RMSprop(G.parameters(), lr=lr, )
  d_scheduler = torch.optim.lr_scheduler.ExponentialLR(d_optimizer, gamma=0.99)
  g_scheduler = torch.optim.lr_scheduler.ExponentialLR(g_optimizer, gamma=0.99)
 
  fake_img = None
 
  # ##########################进入训练##判别器的判断过程#####################
  for epoch in range(num_epoch): # 进行多个epoch的训练
    pbar = builder.MyTqdm(epoch=epoch, maxval=len(dataloader))
    for i, img in enumerate(dataloader):
      num_img = img.size(0)
      real_img = img.cuda() # 将tensor变成Variable放入计算图中
      # 这里的优化器是D的优化器
      for param in D.parameters():
        param.requires_grad = True
      # ########判别器训练train#####################
      # 分为两部分：1、真的图像判别为真；2、假的图像判别为假
 
      # 计算真实图片的损失
      d_optimizer.zero_grad() # 在反向传播之前，先将梯度归0
      real_out = D(real_img) # 将真实图片放入判别器中
      d_loss_real = real_out.mean(0).view(1)
      d_loss_real.backward(one)
 
      # 计算生成图片的损失
      z = torch.randn(num_img, z_dimension).cuda() # 随机生成一些噪声
      z = z.reshape(num_img, z_dimension, 1, 1)
      fake_img = G(z).detach() # 随机噪声放入生成网络中，生成一张假的图片。 # 避免梯度传到G，因为G不用更新, detach分离
      fake_out = D(fake_img) # 判别器判断假的图片，
      d_loss_fake = fake_out.mean(0).view(1)
      d_loss_fake.backward(mone)
 
      d_loss = d_loss_fake - d_loss_real
      d_optimizer.step() # 更新参数
 
      # 每次更新判别器的参数之后把它们的绝对值截断到不超过一个固定常数c=0.01
      for parm in D.parameters():
        parm.data.clamp_(-0.01, 0.01)
 
      # ==================训练生成器============================
      # ###############################生成网络的训练###############################
      for param in D.parameters():
        param.requires_grad = False
 
      # 这里的优化器是G的优化器，所以不需要冻结D的梯度，因为不是D的优化器，不会更新D
      g_optimizer.zero_grad() # 梯度归0
 
      z = torch.randn(num_img, z_dimension).cuda()
      z = z.reshape(num_img, z_dimension, 1, 1)
      fake_img = G(z) # 随机噪声输入到生成器中，得到一副假的图片
      output = D(fake_img) # 经过判别器得到的结果
      # g_loss = criterion(output, real_label) # 得到的假的图片与真实的图片的label的loss
      g_loss = torch.mean(output).view(1)
      # bp and optimize
      g_loss.backward(one) # 进行反向传播
      g_optimizer.step() # .step()一般用在反向传播后面,用于更新生成网络的参数
 
      # 打印中间的损失
      pbar.set_right_info(d_loss=d_loss.data.item(),
                g_loss=g_loss.data.item(),
                real_scores=real_out.data.mean().item(),
                fake_scores=fake_out.data.mean().item(),
                )
      pbar.update()
      try:
        fake_images = to_img(fake_img.cpu())
        save_image(fake_images, dir_path + '/fake_images-{}.png'.format(epoch + 1))
      except:
        pass
      if is_print:
        is_print = False
        real_images = to_img(real_img.cpu())
        save_image(real_images, dir_path + '/real_images.png')
    pbar.finish()
    d_scheduler.step()
    g_scheduler.step()
    save(D, "wgan_D.pt")
    save(G, "wgan_G.pt")

到此这篇关于Pytorch实现WGAN用于动漫头像生成的文章就介绍到这了,更多相关Pytorch实现WGAN用于动漫头像生成内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Pytorch实现WGAN用于动漫头像生成

- Author -

不佛

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python mysqldb连接数据库

Mar 16 Python

Python中声明只包含一个元素的元组数据方法

Aug 25 Python

Python 调用Java实例详解

Jun 02 Python

python中子类调用父类函数的方法示例

Aug 18 Python

Python编程实现蚁群算法详解

Nov 13 Python

python爬虫获取多页天涯帖子

Feb 23 Python

pandas.DataFrame.to_json按行转json的方法

Jun 05 Python

详解python中的Turtle函数库

Nov 19 Python

Python中遍历列表的方法总结

Jun 27 Python

python实现的汉诺塔算法示例

Oct 23 Python

详解anaconda安装步骤

Nov 23 Python

Python实现GIF动图以及视频卡通化详解

Dec 06 Python

基于PyInstaller各参数的含义说明

Mar 04 #Python

解决Pyinstaller打包软件失败的一个坑

Mar 04 #Python

selenium+python自动化78-autoit参数化与批量上传功能的实现

Mar 04 #Python

解决PDF 转图片时丢文字的一种可能方式

Mar 04 #Python

pandas数据分组groupby()和统计函数agg()的使用

Mar 04 #Python

pyx文件生成pyd 文件用于 cython调用的实现

Mar 04 #Python

Python .py生成.pyd文件并打包.exe 的注意事项说明

Mar 04 #Python

You might like

从零开始教你如何搭建Discuz!4.1论坛

2006/07/07 PHP

php邮件发送,php发送邮件的类

2011/03/24 PHP

WIN8.1下搭建PHP5.6环境

2015/04/29 PHP

基于PHP实现简单的随机抽奖小程序

2016/01/05 PHP

YII视图整合kindeditor扩展的方法

2016/07/13 PHP

PHP高精确度运算BC函数库实例详解

2017/08/15 PHP

JavaScript脚本性能优化注意事项

2008/11/18 Javascript

jQuery UI Autocomplete 1.8.16 中文输入修正代码

2012/04/16 Javascript

javascript学习(二)javascript常见问题总结

2013/01/02 Javascript

js调用浏览器打印模块实现点击按钮触发自定义函数

2014/03/21 Javascript

js实现div闪烁原理及实现代码

2014/06/24 Javascript

Javascript基础教程之switch语句

2015/01/18 Javascript

JS+CSS实现Div弹出窗口同时背景变暗的方法

2015/03/04 Javascript

Jquery为DIV添加click事件的简单实例

2016/06/02 Javascript

jQuery实现拖拽页面元素并将其保存到cookie的方法

2016/06/12 Javascript

基于jQuery和CSS3实现APPLE TV海报视差效果

2017/06/16 jQuery

基于Vue-Cli 打包自动生成/抽离相关配置文件的实现方法

2018/12/09 Javascript

vue路由导航守卫和请求拦截以及基于node的token认证的方法

2019/04/07 Javascript

你可能从未使用过的11+个JavaScript特性(小结)

2020/01/08 Javascript

JS实现TITLE悬停长久显示效果完整示例

2020/02/11 Javascript

bootstrap实现tab选项卡切换

2020/08/09 Javascript

JQuery基于FormData异步提交数据文件

2020/09/01 jQuery

实例讲解python函数式编程

2014/06/09 Python

Python中Threading用法详解

2017/12/27 Python

pyqt5之将textBrowser的内容写入txt文档的方法

2019/06/21 Python

Python转换时间的图文方法

2019/07/01 Python

Python datetime 格式化明天,昨天实例

2020/03/02 Python

基于Python绘制美观动态圆环图、饼图

2020/06/03 Python

瑞贝卡·明可弗包包官网：Rebecca Minkoff

2016/07/21 全球购物

Jeep牧马人、切诺基和自由人零配件：4 Wheel Drive Hardware

2017/07/02 全球购物

英国家庭珠宝商：T. H. Baker

2018/02/08 全球购物

大学学年自我鉴定

2013/10/28 职场文书

30年同学聚会感言

2014/01/30 职场文书

房地产广告策划方案

2014/05/15 职场文书

教师三严三实心得体会

2014/10/11 职场文书

保险公司2016开门红口号集锦

2015/12/24 职场文书