WeEdit: A Dataset, Benchmark and Glyph-Guided Framework for Text-centric Image Editing 

  • WeEdit: A Dataset, Benchmark and Glyph-Guided Framework for Text-centric Image Editing [103.7]
    WeEditは、スケーラブルなデータ構築パイプラインと2つのベンチマーク、2段階のトレーニング戦略を含む、システマティックなソリューションである。 具体的には、多様な編集操作と15言語をカバーする330Kのトレーニングペアを生成するHTMLベースの新しい自動編集パイプラインを提案する。 アルゴリズム面では、グリフ誘導による微調整を用いて、空間的および内容的事前の明示を注入し、次いで、命令の順守、テキストの明瞭さ、背景の保存と、生成を整合させる多目的強化学習ステージを用いる。
    論文  参考訳(メタデータ)   (Thu, 12 Mar 2026 06:25:09 GMT)
  • テキストによる画像編集
  • プロジェクトサイトはWeEdit: A Dataset, Benchmark and Glyph-Guided Framework for Text-centric Image Editing

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です