LinkGAN: Linking GAN Latents to Pixels for Controllable Image Synthesis [63.6] この研究は、GANトレーニングのための使い易い正規化器を示し、潜在空間のいくつかの軸を画像領域や意味圏に明示的にリンクするのに役立つ。 実験の結果,LinkGANと呼ばれる正則化器の4つの魅力特性が確認された。 論文参考訳(メタデータ) (Wed, 11 Jan 2023 17:56:36 GMT)
「we have decided not to release our Parti models, code, or data for public use without further safeguards in place.」とのこと。クローズドな方針は議論を呼びそう。(とはいえ、公開されたからといって計算リソース的に再現は容易ではないが…)
“GAN I hire you?” — A System for Personalized Virtual Job Interview Training [49.2] 本研究では,GAN(Generative Adversarial Network)に基づく対話型面接訓練システムを開発した。 その結果,GANをベースとした行動フィードバックが有用であることが示唆された。 論文参考訳(メタデータ)参考訳(全文) (Wed, 8 Jun 2022 13:03:39 GMT)
Long Video Generation with Time-Agnostic VQGAN and Time-Sensitive Transformer [66.6] 本稿では3D-VQGANとトランスフォーマーを使って数千フレームのビデオを生成する手法を提案する。 評価の結果,16フレームのビデオクリップでトレーニングしたモデルでは,多種多様でコヒーレントで高品質な長編ビデオが生成できることがわかった。 また,テキストと音声に時間情報を組み込むことで,有意義な長ビデオを生成するための条件付き拡張についても紹介する。 論文参考訳(メタデータ)参考訳(全文) (Thu, 7 Apr 2022 17:59:02 GMT)
SLOGAN: Handwriting Style Synthesis for Arbitrary-Length and Out-of-Vocabulary Text [35.8] 本稿では,任意の長文と語彙外文に対して,パラメータ化および制御可能な手書きスタイルを合成する手法を提案する。 我々は、容易に入手可能な印刷スタイルの画像を提供することで、テキストコンテンツを埋め込むことにより、コンテンツの多様性を柔軟に達成することができる。 本手法は,学習語彙に含まれない単語を,様々な新しいスタイルで合成することができる。 論文参考訳(メタデータ)参考訳(全文) (Wed, 23 Feb 2022 12:13:27 GMT)
Sketch Your Own GAN [36.8] 本稿では1つ以上のスケッチでGANを書き換える手法であるGAN Sketchingを提案する。 我々は、ドメイン間の敵対的損失を通じて、ユーザスケッチにマッチするようにモデルの出力を奨励する。 提案手法は,写実性や多様性を保ちながら,スケッチで指定した形状やポーズに適合するGANを成形できることを示した。 論文参考訳(メタデータ)参考訳(全文) (Thu, 5 Aug 2021 17:59:42 GMT)