Many-Shot In-Context Learning in Multimodal Foundation Models

Many-Shot In-Context Learning in Multimodal Foundation Models [4.8]
マルチモーダルファンデーションモデルの性能を,少数ショットから多ショットICLまで評価した。マルチショットICLは、全データセットにわたる少数ショット(100例)のICLと比較して、大幅に改善される。ゼロショットとマルチショットのICLでは,最大50のクエリでパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (Thu, 16 May 2024 04:02:43 GMT)
MLLMの評価、評価対象にGPT-4oが入っているのが驚き、対応が速い。全般的にMany shotには効果があるよう。GPT-4oとGemini Proの比較ではGPT-4oが優位でないタスクも多い。また、ManyShotでの特性もかなり異なるようにみえるのが興味深い。
リポジトリはGitHub – stanfordmlgroup/ManyICL

コメントを残す

コメントを残す コメントをキャンセル