Scaling up GANs for Text-to-Image Synthesis – arXiv最新論文の紹介

Scaling up GANs for Text-to-Image Synthesis [59.5]
テキストから画像への合成が最近成功したことで、世界は嵐にさらされ、一般大衆の想像力を捉えた。技術的な観点から言えば、生成的イメージモデルを設計するために好まれるアーキテクチャが劇的に変化した。GANはかつて、StyleGANのようなテクニックを使って、事実上の選択肢でした。 DALL-E 2では、自動回帰モデルと拡散モデルが大規模生成モデルの新たな標準となった。我々は,この限界を超える新しいGANアーキテクチャであるGigaGANを紹介する。
論文参考訳（メタデータ） (Thu, 9 Mar 2023 18:59:47 GMT)
Stable Diffusionを超える（低いFID）性能のGANアーキテクチャのモデル。プロジェクトサイトを見る限り品質が高く、そして動作が高速。
リポジトリはGigaGAN: Scaling up GANs for Text-to-Image Synthesis (mingukkang.github.io)

コメントを残す

コメントを残す コメントをキャンセル