- An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion [60.1]
テキスト・ツー・イメージモデルは、自然言語による創造をガイドする前例のない自由を提供する。 ここでは、そのような創造的な自由を可能にするシンプルなアプローチを提示します。 一つの単語の埋め込みが、ユニークで多様な概念を捉えるのに十分であることを示す。
論文 参考訳(メタデータ) (Tue, 2 Aug 2022 17:50:36 GMT)- 数枚の画像をソースとしてテキスト指示により新たな画像を生み出す研究。ソース画像を表す疑似単語を探し、それを用いてテキスト入力による画像生成を行うアプローチ。生成する画像を狙いやすくなる有用そうな研究。
- プロジェクトサイトはAn Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion (textual-inversion.github.io)