コンテンツへスキップ
- Edit-A-Video: Single Video Editing with Object-Aware Consistency [21.0]
本稿では,事前訓練されたTTIモデルと単一のテキスト,ビデオ>ペアのみを付与したビデオ編集フレームワークを提案する。 本フレームワークは,(1)時間モジュールチューニングを付加して2Dモデルを3Dモデルに膨らませること,(2)原動画をノイズに反転させ,対象のテキストプロンプトとアテンションマップインジェクションで編集すること,の2段階からなる。 各種のテキスト・ビデオに対して広範な実験結果を示し,背景整合性,テキストアライメント,ビデオ編集品質の点で,ベースラインに比べて提案手法の優位性を示す。
論文 参考訳(メタデータ) (Thu, 23 Mar 2023 03:04:45 GMT)
- テキストによる動画編集。「人間がギターを弾いているビデオ」+「“a bear is playing a guitar”」という入力で、ギターを弾いている人をクマに変更ができる。
- 画像でできたことは動画でもできる、というのはわかるがとても面白い。
- プロジェクトサイトはEdit-A-Video<span>:</span> Single Video Editing with Object-Aware Consistency
- Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning [16.1]
タスクのセマンティクスは入力から出力までの例のセットやテキストによる命令で表現できる。 コミュニティは、NLPの新しい監視-探索パラダイム、すなわちタスク命令から学ぶことに、ますます関心を払っている。
論文 参考訳(メタデータ) (Tue, 21 Mar 2023 01:27:16 GMT)
- PromptのようなInstruction Learningのサーベイ
- 新興分野でもありまた現在の流行の中で重要な要素でもあり、歴史を振り返る上でも参考になる