- Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks [39.1]
Unified-IOは、古典的なコンピュータビジョンタスクにまたがるさまざまなAIタスクを実行するモデルである。 我々は、サポート対象の入力と出力を個別の語彙トークン列に均質化することで、この統一を実現する。 Unified-IOはGRITベンチマークで7つのタスクすべてを実行することができる最初のモデルである。
論文 参考訳(メタデータ) 参考訳(全文) (Fri, 17 Jun 2022 17:53:47 GMT)- 非常に多様なデータ、タスクを扱えるモデルの提案。
- META LMでも感じたが、汎用に使えるAI(しかも事前学習済み)は夢物語ではなくなりつつあると感じる。そしてマルチモーダルをつなぐのは言語なのだろうか。
- プロジェクトサイトはUnified-IO, a new general purpose model from AI2 (allenai.org)
- 非常に多様なデータ、タスクを扱えるモデルの提案。