- Autoregressive Models in Vision: A Survey [119.2]
本調査は、視覚に適用される自己回帰モデルに関する文献を包括的に調査する。 視覚的自己回帰モデルを,画素ベース,トークンベース,スケールベースを含む3つの一般的なサブカテゴリに分割する。 本稿では,画像生成,映像生成,3D生成,マルチモーダル生成など,コンピュータビジョンにおける自己回帰モデルの多面的分類を提案する。
論文 参考訳(メタデータ) (Fri, 08 Nov 2024 17:15:12 GMT) - Towards Unifying Understanding and Generation in the Era of Vision Foundation Models: A Survey from the Autoregression Perspective – arXiv最新論文の紹介でも取り上げた通りVisionにも応用が進むAutoregressiveモデルのサーベイ。
- リポジトリはGitHub – ChaofanTao/Autoregressive-Models-in-Vision-Survey: The paper collections for the autoregressive models in vision.