ソース画像＋テキスト指示による新たな画像の生成

An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion [60.1]
テキスト・ツー・イメージモデルは、自然言語による創造をガイドする前例のない自由を提供する。ここでは、そのような創造的な自由を可能にするシンプルなアプローチを提示します。一つの単語の埋め込みが、ユニークで多様な概念を捉えるのに十分であることを示す。
論文参考訳（メタデータ） (Tue, 2 Aug 2022 17:50:36 GMT)
- 数枚の画像をソースとしてテキスト指示により新たな画像を生み出す研究。ソース画像を表す疑似単語を探し、それを用いてテキスト入力による画像生成を行うアプローチ。生成する画像を狙いやすくなる有用そうな研究。
- プロジェクトサイトはAn Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion (textual-inversion.github.io)

コメントを残す

コメントを残す コメントをキャンセル