Step-DeepResearch Technical Report

  • Step-DeepResearch Technical Report [90.5]
    コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。 我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。 中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
    論文  参考訳(メタデータ)   (Tue, 23 Dec 2025 16:32:27 GMT)
  • StepFunによるディープリサーチエージェントと評価ベンチマークの提案。「Experimental results demonstrate that Step-DeepResearch, with only 32B parameters, achieves a high score of 61.4% on the Scale AI Research Rubrics. In expert human evaluations on ADR-Bench, its Elo score significantly outperforms comparable models and rivals state-of-the-art closed-source models such as OpenAI DeepResearch and Gemini DeepResearch.」と高性能を主張。実行にはAPI接続が必要でこれもclosedでは?と思わなくもない。。
  • リポジトリはGitHub – stepfun-ai/StepDeepResearch: Step-DeepResearch

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です