Step-DeepResearch Technical Report – arXiv最新論文の紹介

Step-DeepResearch Technical Report [90.5]
コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
論文参考訳（メタデータ） (Tue, 23 Dec 2025 16:32:27 GMT)
StepFunによるディープリサーチエージェントと評価ベンチマークの提案。「Experimental results demonstrate that Step-DeepResearch, with only 32B parameters, achieves a high score of 61.4% on the Scale AI Research Rubrics. In expert human evaluations on ADR-Bench, its Elo score significantly outperforms comparable models and rivals state-of-the-art closed-source models such as OpenAI DeepResearch and Gemini DeepResearch.」と高性能を主張。実行にはAPI接続が必要でこれもclosedでは？と思わなくもない。。
リポジトリはGitHub – stepfun-ai/StepDeepResearch: Step-DeepResearch

コメントを残す

コメントを残す コメントをキャンセル