|
如果说 StyleGAN 1-2-3 是升级换代,那么从 StyleGAN3 到 StyleGAN-XL / StyleGAN-T 则是一次全面的进化。 StyleGAN-XL 是基于 StyleGAN3 和 Projected GAN 的重大进化版本。这篇工作也是在图像生成 (非 text-to-image) 任务上超过了几个经典 diffusion model 的。StyleGAN-T 则是在 StyleGAN-XL 的基础上加入了 CLIP 从而加入了 text-to-image 俱乐部最高层。有意思的是,相比于 StyleGAN 1-3 都是 NVIDIA Research 做出的工作,StyleGAN-XL 是德国高校的作品, 而后续的 StyleGAN-T 则是这所德国高校和 NVIDIA 两方合作完成的。
|