英伟达年底放大招!发布超强图像生成器StyleGAN2

新闻 人工智能
今年年初,英伟达(NVIDIA)的研究工程师们公开了StyleGAN的源代码,并将其作为生成对抗网络的基于Style的生成器架构。

 今年年初,英伟达(NVIDIA)的研究工程师们公开了StyleGAN的源代码,并将其作为生成对抗网络的基于Style的生成器架构。

比如可以生成无数逼真的人脸:

英伟达年底放大招!发布最强图像生成器StyleGAN2

还能让你看到从萝莉到御姐的变换过程是怎样的:

虽说功能强大,但毕竟是初代版本,难免有些瑕疵,现如今,升级版StyleGAN2诞生了,英伟达近日公开最新论文《Analyzing and Improving the Image Quality of StyleGAN》,通过对 StyleGAN 的生成效果分析,对不完美的工作设计了改进和优化方法,下面一起来看看都有哪些升级:

1、消除特征伪影

英伟达年底放大招!发布最强图像生成器StyleGAN2

就如上图所示,StyleGAN图像中会出现类似水滴的伪影,这些在生成的时候虽然说没有很明显,但是问题总归是存在的,而且从生成64×64的图像开始就有了,分辨率越高,水滴现象就越严重。在StyleGAN2里面这个问题已经不存在了。

英伟达的研究人员重新设计了StyleGAN架构,研究了常见的斑点状artifacts的起源,并发现生成器创建它们是为了规避其架构中的设计缺陷。英伟达重新设计了生成器中使用的normalization,从而删除了artifacts。

英伟达年底放大招!发布最强图像生成器StyleGAN2

如上图所示,(a)是原始StyleGAN架构,(b)展示了原始StyleGAN架构的细节,(c)是在原始架构里做了些许改动,(d)是修改后的架构。

改进完之后的效果如下:

已经没有了前面所说的伪影,同时保留了完全的可控性。

2、生成细节改进

再来看看StyleGAN中采用的是Progressive Growing的训练方法,细节对位置有强偏好,特征发生移动时,位置不能随之发生相应的变化移动。

英伟达年底放大招!发布最强图像生成器StyleGAN2

StyleGAN 2研究人员对其进行了优化,如上图所示,up和down分别表示双线性上、下采样。当牙齿或者眼睛等特征在图像上平滑移动时,它们可能会停留在原位,然后跳到下一个首选位置,下图显示了相关的伪像,生成人脸的五官特征可以同时变化。

英伟达年底放大招!发布最强图像生成器StyleGAN2

总的来说,StyleGAN 2的改进如下:

生成的图像质量明显更好(FID分数更高、artifacts减少)

提出替代progressive growing的新方法,牙齿、眼睛等细节更完美

改善了Style-mixing

更平滑的插值(额外的正则化)

训练速度更快

 

是不是觉得很强大呢?想不想自己体验一番,最后附上相关地址:

论文地址:https://arxiv.org/pdf/1912.04958.pdf

Github地址:https://github.com/NVlabs/stylegan2

 

责任编辑:张燕妮 来源: 开源最前线
相关推荐

2020-03-09 09:54:44

AI 数据人工智能

2023-05-04 16:24:10

人工智能图像生成器

2023-03-06 10:29:37

人工智能威胁

2023-05-29 16:14:00

英伟达GPU

2024-03-07 20:35:20

微软人工智能

2023-02-06 10:25:13

AI模型

2021-04-22 21:15:38

Generator函数生成器

2010-09-07 16:31:17

SQL语句insert

2011-12-23 13:42:05

JavaScript

2023-01-26 10:55:55

生成器Astro静态站点

2024-02-29 16:35:01

StarCoder2大型语言模型人工智能

2015-08-25 11:07:58

2017-07-01 16:02:39

分布式ID生成器

2024-08-29 14:48:42

2024-11-01 15:51:06

2021-01-12 15:20:39

AI 数据人工智能

2023-05-17 16:02:00

CSS工具代码生成器

2021-12-04 22:07:44

Python

2015-08-25 15:54:17

程序员代码生成器

2017-09-06 09:26:03

Python生成器协程
点赞
收藏

51CTO技术栈公众号