SCORE: Self-COrrection ability in REasoning tasks

Small Language Models Need Strong Verifiers to Self-Correct Reasoning [69.9]
大規模言語モデル(LLM)の推論性能を高めるための有望なソリューションとして自己補正が登場した。本研究は,より小さい (= 13B) 言語モデル (LM) が,より強い LM から最小限の入力で推論タスクを自己補正できるかどうかを考察する。
論文参考訳（メタデータ） (Fri, 26 Apr 2024 03:41:28 GMT)
自己補正を強化するためのfine tuningプロセスの提案。学習用データをモデルに作らせるアプローチで自分自身を強化している感がある。
リポジトリはhttps://github.com/yunx-z/SCOREとのことだが、現在はNotFound

コメントを残す

コメントを残す コメントをキャンセル