Self-Taught Self-Correction for Small Language Models

Self-Taught Self-Correction for Small Language Models [16.5]
本研究は,自己生成データのみを用いた反復的微調整により,小言語モデル(SLM)における自己補正を探索する。複数のアルゴリズム設計選択を組み込んだ自己学習自己補正アルゴリズム(STaSC)を導入する。質問応答タスクの実験結果から,STaSCは自己補正を効果的に学習し,性能が大幅に向上することが示された。
論文参考訳（メタデータ） (Tue, 11 Mar 2025 17:57:44 GMT)
STaRに自己補正を様々組み込んだSelf-Taught Self-Correction (STaSC)の提案。
リポジトリはGitHub – VityaVitalich/STASC: [ICLR 2025 SSI-FM] Self-Taught Self-Correction for Small Language Models

コメントを残す

コメントを残す コメントをキャンセル