Retrieved In-Context Principles from Previous Mistakes 

  • Retrieved In-Context Principles from Previous Mistakes [55.1]
    In-context Learning (ICL) は、入力出力の正しい例を用いて、下流のタスクにLarge Language Models (LLM) を適用するのに役立っている。 近年の進歩は、ミスから派生した原則により、モデルパフォーマンスの改善を試みている。 本稿では,新しい教師学習フレームワークであるRetrieved In-Context Principles (RICP)を提案する。
    論文  参考訳(メタデータ)   (Mon, 08 Jul 2024 07:32:26 GMT)
  • 「a teacher-student framework designed to prevent the student model from making previous mistakes.」というフレームワークの提案。学生モデルが犯したミスを教師モデルが分析し、従うべき原則を作っていくフレームワークを提案。様々なベンチマークで効果を確認とのこと。
  • 潜在的なLeakageがないか気になるが、エージェント的動作の結果を「原則」にまとめて再利用可能にしていると考えれば効果がありそう。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です