Battle of the Backbones: A Large-Scale Comparison of Pretrained Models across Computer Vision Tasks

  • Battle of the Backbones: A Large-Scale Comparison of Pretrained Models across Computer Vision Tasks [139.4]
    Battle of the Backbones (BoB)は、ニューラルネットワークベースのコンピュータビジョンシステムのためのベンチマークツールである。 視覚変換器(ViT)と自己教師型学習(SSL)がますます人気になっている。 同じアーキテクチャと同じようなサイズの事前トレーニングデータセット上でのアップルとアプリケーションの比較では、SSLバックボーンは極めて競争力があることが分かりました。
    論文  参考訳(メタデータ)   (Mon, 30 Oct 2023 18:23:58 GMT)
  • 事前学習済みのバックボーンを様々なタスクで比較した論文。「Across the suite of comprehensive evaluations in BoB, spanning tasks, datasets, and settings (including ID and OOD), supervised ConvNeXt-Base, supervised SwinV2-Base trained using ImageNet-21k, and CLIP ViT-Base come out on top.」とのこと。端的にまとまっているのがありがたい。
  • リポジトリはGitHub – hsouri/Battle-of-the-Backbones

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です