An Empirical Study of Training Self-Supervised Visual Transformers [70.3] self-supervisedな視覚トランスフォーマーの訓練におけるいくつかの基本成分の影響について検討する。ViTの学習における基礎的要素の影響について検討する。 不安定性は精度を低下させる主要な問題であり、明らかに良い結果によって隠すことができる。 これらの結果は確かに部分的な失敗であり、トレーニングをより安定させると改善できる。 論文参考訳(メタデータ)参考訳(全文) (Mon, 5 Apr 2021 17:59:40 GMT)