- Next Token Prediction Towards Multimodal Intelligence: A Comprehensive Survey [93.7]
Next Token Prediction (NTP)は、機械学習タスクの多目的な学習目標である。 本調査では,マルチモーダル学習における理解と生成を一体化する包括的分類法を導入する。 提案した分類法は,マルチモーダルトークン化,MMNTPモデルアーキテクチャ,統合タスク表現,データセットと評価,オープンチャレンジの5つの重要な側面を網羅している。
論文 参考訳(メタデータ) (Mon, 30 Dec 2024 03:00:30 GMT) - 一般的なテクニックとなったNext token predictionのサーベイ、マルチモーダルな学習を対象にしている。
- リポジトリはGitHub – LMM101/Awesome-Multimodal-Next-Token-Prediction: Next Token Prediction Towards Multimodal Intelligence: A Comprehensive Survey