鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

账号设置退出

英伟达年底放大招！发布超强图像生成器StyleGAN2

作者：猿妹编译 2019-12-20 10:20:02

新闻人工智能

今年年初，英伟达（NVIDIA）的研究工程师们公开了StyleGAN的源代码，并将其作为生成对抗网络的基于Style的生成器架构。

今年年初，英伟达（NVIDIA）的研究工程师们公开了StyleGAN的源代码，并将其作为生成对抗网络的基于Style的生成器架构。

比如可以生成无数逼真的人脸：

è‹±ä¼Ÿè¾¾å¹´åº•æ”¾å¤§æ‹›ï¼å‘å¸ƒæœ€å¼ºå›¾åƒç”Ÿæˆå™¨StyleGAN2

还能让你看到从萝莉到御姐的变换过程是怎样的：

虽说功能强大，但毕竟是初代版本，难免有些瑕疵，现如今，升级版StyleGAN2诞生了，英伟达近日公开最新论文《Analyzing and Improving the Image Quality of StyleGAN》，通过对 StyleGAN 的生成效果分析，对不完美的工作设计了改进和优化方法，下面一起来看看都有哪些升级：

1、消除特征伪影

è‹±ä¼Ÿè¾¾å¹´åº•æ”¾å¤§æ‹›ï¼å‘å¸ƒæœ€å¼ºå›¾åƒç”Ÿæˆå™¨StyleGAN2

就如上图所示，StyleGAN图像中会出现类似水滴的伪影，这些在生成的时候虽然说没有很明显，但是问题总归是存在的，而且从生成64×64的图像开始就有了，分辨率越高，水滴现象就越严重。在StyleGAN2里面这个问题已经不存在了。

英伟达的研究人员重新设计了StyleGAN架构，研究了常见的斑点状artifacts的起源，并发现生成器创建它们是为了规避其架构中的设计缺陷。英伟达重新设计了生成器中使用的normalization，从而删除了artifacts。

è‹±ä¼Ÿè¾¾å¹´åº•æ”¾å¤§æ‹›ï¼å‘å¸ƒæœ€å¼ºå›¾åƒç”Ÿæˆå™¨StyleGAN2

如上图所示，(a)是原始StyleGAN架构，(b)展示了原始StyleGAN架构的细节，(c)是在原始架构里做了些许改动，(d)是修改后的架构。

改进完之后的效果如下：

已经没有了前面所说的伪影，同时保留了完全的可控性。

2、生成细节改进

再来看看StyleGAN中采用的是Progressive Growing的训练方法，细节对位置有强偏好，特征发生移动时，位置不能随之发生相应的变化移动。

è‹±ä¼Ÿè¾¾å¹´åº•æ”¾å¤§æ‹›ï¼å‘å¸ƒæœ€å¼ºå›¾åƒç”Ÿæˆå™¨StyleGAN2

StyleGAN 2研究人员对其进行了优化，如上图所示，up和down分别表示双线性上、下采样。当牙齿或者眼睛等特征在图像上平滑移动时，它们可能会停留在原位，然后跳到下一个首选位置，下图显示了相关的伪像，生成人脸的五官特征可以同时变化。

è‹±ä¼Ÿè¾¾å¹´åº•æ”¾å¤§æ‹›ï¼å‘å¸ƒæœ€å¼ºå›¾åƒç”Ÿæˆå™¨StyleGAN2

总的来说，StyleGAN 2的改进如下：

生成的图像质量明显更好(FID分数更高、artifacts减少)

提出替代progressive growing的新方法，牙齿、眼睛等细节更完美

改善了Style-mixing

更平滑的插值(额外的正则化)

训练速度更快

是不是觉得很强大呢？想不想自己体验一番，最后附上相关地址：

论文地址：https://arxiv.org/pdf/1912.04958.pdf

Github地址：https://github.com/NVlabs/stylegan2

责任编辑：张燕妮来源：开源最前线

图像识别 AI 机器视觉

51CTO技术栈公众号

业务
速览

媒体

51CTO CIOAge HC3i

社区

51CTO博客鸿蒙开发者社区 AI.x社区

教育

51CTO学堂精培企业培训 CTO训练营