首页 国际新闻正文

编者按:生成敌对网络 (GAN) 是深度学习中最风趣、最受欢迎的运用之一。本文列出了 10 篇关于 GA止咳药,带你读论文 | 生成敌对网络GAN论文TOP 10,明日之后N 的论拍拍拍拍文,这些论文将为你供给一个很好的对 GAN 的介绍,协助你了解最早进技能的根底。本文由微信大众号“新智元”编译自文章“Must-Read Papers on GANs”,深存记经授权转载。

本文挑选的 10 篇 GAN 论文包含:

1. DCGANs

2. Improved Techniques for Training GANs

3. Conditional GANs

4. Progressively Growing GANs

5. BigGAN

6. StyleGAN

7. CycleGAN

8. Pix2Pix

9. StackGAN

10. Generative Adversarial Networks

1. DCGANs — Radford et al. (2015)

我主张你以 DCGAN 这篇论文来敞开你的 GAN 之旅。这篇论文展现了卷积层怎么与GAN 一同运用,并为此供给了一系列架构攻略。这篇论文还评论了 GAN 特征的可视化、潜在空间插值、运用判别器特征来操练分类器、评价成果等问题。所有这些问题都必定会出村庄引诱现在你的 GAN 研讨中。

止咳药,带你读论文 | 生成敌对网络GAN论文TOP 10,明日之后

总归,DCGAN 论文是一篇必读的 GAN 论文,由于它以一种十分明晰的办法界说架构,因而很简略从一些代码开端,并开端构成开发 GAN的直觉。

DC止咳药,带你读论文 | 生成敌对网络GAN论文TOP 10,明日之后GAN 模型:具有上采样卷积层的生成器架构

论文:

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

Alec Radford, Luke Metz, Soumith Chin梨花雨副市长女犯视频tala

h很紧ttps://arxiv.org/abs/1511.06434

2. 改善 GAN 操练的技能 —— Salimans et al. (2016)

这篇论文 (作者包含 Ian Goodfellow) 依据上述 DCGAN 论文中列出的架构攻略,供给了一系列主张。这篇论文将协助你了解 GAN 不安稳性的最佳假定。此外,本文还供给了许多用于安稳 DCGAN 操练的其他机器,包含特征匹配、 minibatch 辨认、前史均匀、单边标签滑润和虚拟批标准化。运用这些技巧来构建一个简略的 DCGAN 完成是一个很好的操练,有助于更深化地了解 GAN。

论文:

Improved T薛瑞众echniques for Training GANs

Tim Salimans, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford, Xi Chen

https://arxiv.org/abs/1606.03498

3. Condi止咳药,带你读论文 | 生成敌对网络GAN论文TOP 10,明日之后tional GANs — Mirza and Osindero (2014)

这是一篇很好的论文,读起来很顺利。条件 GAN(Conditional GAN) 是最早进的 GAN之一。论文展现了怎么整合数据的类标签,从而使 GAN 操练愈加安稳。运用先验信息对 GAN 进行调理这样的概念,在尔后的 GAN 研讨中是一个重复呈现的主题,关于侧重于 image-to-image 或 text-to-image 的论文特别重要。

Conditional GAN 架构:除了随机噪声向量 z 之外,类标签 y 被衔接在一同作为网络的输入

论文:

Conditional Generative Adversarial Nets

Mehdi Mirza, Simon Osindero

https://arxiv.org/abs/1411.1784

4. Progressively Growing GANs— Karras et al. (2017)

Progressively Growing GAN (PG-GAN) 有着惊人的成果,以及对 GAN 问题的创造性办法,因而也是一篇必读论文。

这篇 GAN 论文来自 NVIDIA Research,提出以一种渐进增大(progressive growing)的办法操练 GAN,经过运用逐渐增大的 GAN 网络(称为 PG-GAN)和精心处理的CelebA-H和继父Q 数据集,完成了作用令人惊叹的生成图画。作者表明,这种办法不只安稳了操练,GAN 生成的图画也是迄今为止质量最好的。

它的要害主意是渐进地增大生成器和鉴别器:从低分辨率开端,跟着操练的发展,增加新的层对越来越精密的细节进行建模。“Progressive Growing” 指的是先操练 4x4 的网络,然后操练 8x8,不断增大,终究到达 1024x1024。这既加快了操练速度,又大大安稳了操练速度,并且生成的图画质量十分高。

Progressively Growing GAN 的多标准架构,模型从 44 逐渐增大到 10241024

论文:

Progressive Growing of GANs for Improved Quality, Stability, and Variation

Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen

https://arxiv.org/abs/1710.10196

5. BigGAN — Brock et al. (2019)

BigGAN 模型是根据 ImageNet 生成图画质量最高的模型之一。该模型很难在本地机器上完成,并且 BigGAN 有许多组件,吮奶如 Self-Attention、 Spectral Normalization 和带有投影鉴别器的 cGAN,这些组件在各自的论文中都有更好的解说。不过,这篇论文对构成当时最早进技能水平的根底论文的思维供给了很好的概述,因而十分值得阅览。

BigGAN 生成的图画

论文:

Large Scale GAN Training for High Fidelity Natural Image Syn荀勖thesis

Andrew Brock, Jeff Donahue, Karen Simonyan

https://arxiv.org/abs/1809.11096

6. StyleGAN — Karras et al. (2019)

StyleGAN 模型能够说是最早进的,特别是运用了潜在空间操控。该模型学习了神经风格搬迁中一种称为自适应实例标准化 (AdaIN) 的机制来操控潜在空间向量 z。映射网络和 AdaIN 条件在整个生成器模型中的散布的结合使得很难自己完成一个 StyleGAN,但它仍是一篇很好的论文,包含了许多风趣的主意。

StyleGAN 架构,答应潜在空间操控

论文:

A Style-Based Generator Architecture for Generative Adversarial Networks

Tero Karras, Samuli Laine, Timo Aila

https://arxiv.org/abs/1812.04948

7. CycleGAN — Zhu et al. (2017)

CycleGAN 的论文不同于前面罗列的 6 风月海棠篇论文,由于它评论的是 image-to-imag惠佳俊e 的转化问题,而不是随机向量的图画组成问题。CycleGAN 更详细地处理了没有成对操练样本的 image-to-image 转化的状况。但是,由于 Cycle-Consistency loss 公式的高雅性,以及怎么安稳 GAN 操练的启发性,这是一篇很好的论文。CycleGAN 有许多很帅的运用,比方超分辨率,风格转化,例如将马的图画变成斑马。

Cycle Consistency Loss 背面的首要主意,一个语句从法语翻译成英语,再翻译回法语,应该跟本来的是同一个语句

论文:

Unpaired Image-to-Image Tran止咳药,带你读论文 | 生成敌对网络GAN论文TOP 10,明日之后slation using Cycle-Consistent Adversarial Networks

Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros

https://晋嫣吧官博arxiv.org/abs/1703.10593

8. P黄筱琳ix2Pix — Isola et al. (2016)

Pix2Pix 是另一种图画到图画转化的 GAN 模型。该结构运用成对的操练样本,并在GAN 模型中运用多种不同的装备。读这篇论文时,我觉得最风趣部分是关于 PatchGAN的评论。PatchGAN 经过调查图画的 7070 的区域来判别它们是真的仍是假的,而不是检查整个图画。该模型还展现了一个风趣的 U-Net 风格的生成器架构,以及在生成器模型中运用 ResNet 风格的 skip connections。 Pix2Pix 有许多很帅的运用,比方将草图转化成传神的相片。

运用成对的操练样本进行 Image-to-Image 转化

论文:

Image-to-Image Translation with Conditional Adversarial Networks

Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros

https://arxiv.org/abs/1611.07004

9. StackGAN — Zhang et al. (2017)

StackGAN 的论文与本列表中的前几篇论文比较十分不同。它与 Conditional GAN 和Progressively Growing GANs 最为类似。StackGAN 模型的作业原理与 Progressively Growing GANs 类似,由于它能够在多个标准上作业。StackGAN 首要输出分辨率为6464 的图画,然后将其作为先验信息生成一个 256256 分辨率的图画。

StackGAN是从自然语言文本生成图画。这是经过改动文蔡妍不带罩的相片本嵌入来完成的,以让儿子停课晒太阳便捕获视觉特征。这是一篇十分风趣的文章,假如 止咳药,带你读论文 | 生成敌对网络GAN论文TOP 10,明日之后StyleGAN 中显现的潜在空间操控与 StackGAN 中界说的自然语言接口相结合,想必会十分令人惊奇。

根据文本嵌入的 StackGAN 多标准架构背面的主意

论文:

StackGAN:Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks

Han Zhang, Tao Xu,止咳药,带你读论文 | 生成敌对网络GAN论文TOP 10,明日之后 Hongsheng Li, Shaoting Zhang, Xiaogang Wang, Xiaolei Huang, Dimitris Metaxas

https://arxiv.org/abs/1612.03242

10. Generative Adversarial Networks — Goodfellow et al. (2014)

Ian Goodfellow 的原始 GAN 论文对任何研讨 GAN 的人来说都是必读的。这篇论文界说了 GAN 结构,并评论了 “非饱和” 丢失函数。论emp002文还给出了最优判别器的推导,这是近年来 GAN 论文中经常呈现的一个证明。论文还在 MNIST、TFD 和 CIFAR-10 图画数据集上对 GAN 的有效性进行了试验验证。

论文:

Generative Adversarial Networks

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil 熊吖Ozair, Aaron Courville, Yoshua Bengio

https://arxiv.or曹格的老婆g/abs/1406.2661

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。