Enabling Scalable Oversight via Self-Evolving Critic
Enabling Scalable Oversight via Self-Evolving Critic [59.9] SCRIT(Self-evolving CRITic)は、批評能力の真の自己進化を可能にするフレームワークである。 コントラストベースの自己批判によって生成される合成データのトレーニングによって自己改善する。 最大で10.3%の改善が達成されている。 論文参考訳(メタデータ) (Fri, 10 Jan 2025 05:51:52 GMT)
SCRIT (Selfevolving CRITic)「Technically, SCRIT self-improves by training on synthetic data, generated by a contrastive-based selfcritic that uses reference solutions for step-by-step critique, and a self-validation mechanism that ensures critique quality through correction outcomes.」の提案