- Deep Think with Confidence [33.2]
私たちはDeep Think with Conf(DeepConf)という,テスト時の推論効率とパフォーマンスを両立させる,シンプルかつ強力な手法を紹介します。 DeepConfは、生成時に低品質な推論トレースを動的にフィルタリングし、トークン生成を削減しながら精度を維持または向上させます。評価の結果、DeepConfはAIME 2025などの課題で99.9%の精度を達成し、従来の方法に比べて84.7%のトークン削減を実現しました。
論文 参考訳(メタデータ) (Thu, 21 Aug 2025 05:48:38 GMT) - モデル内の確信度を活用して推論を制御する手法の提案。シンプルだが強力とのこと。
- リポジトリはDeep Think with Confidence