Retrieved In-Context Principles from Previous Mistakes

Retrieved In-Context Principles from Previous Mistakes [55.1]
In-context Learning (ICL) は、入力出力の正しい例を用いて、下流のタスクにLarge Language Models (LLM) を適用するのに役立っている。近年の進歩は、ミスから派生した原則により、モデルパフォーマンスの改善を試みている。本稿では,新しい教師学習フレームワークであるRetrieved In-Context Principles (RICP)を提案する。
論文参考訳（メタデータ） (Mon, 08 Jul 2024 07:32:26 GMT)
「a teacher-student framework designed to prevent the student model from making previous mistakes.」というフレームワークの提案。学生モデルが犯したミスを教師モデルが分析し、従うべき原則を作っていくフレームワークを提案。様々なベンチマークで効果を確認とのこと。
潜在的なLeakageがないか気になるが、エージェント的動作の結果を「原則」にまとめて再利用可能にしていると考えれば効果がありそう。

コメントを残す

コメントを残す コメントをキャンセル