Training Software Engineering Agents and Verifiers with SWE-Gym 

  • Training Software Engineering Agents and Verifiers with SWE-Gym [89.6]
    SWE-Gymは、現実世界のソフトウェアエンジニアリング(SWE)エージェントをトレーニングするための最初の環境である。 SWE-Gymには2,438の現実世界のPythonタスクインスタンスが含まれている。
    論文  参考訳(メタデータ)   (Mon, 30 Dec 2024 18:15:39 GMT)
  • ソフトウェアエンジニアリング用エージェント開発のための環境の提案、および、高性能なエージェントの開発。o3で圧倒的な結果を見た後ではあるが、「Through extensive experiments, we demonstrate that SWE-Gym enables both agent and verifier models to achieve significant improvements in resolving complex software tasks. Our findings highlight the scalability of these approaches, revealing potential for continuous performance gains with increased compute.」とエージェント的動作の有効性は高い。
  • リポジトリはGitHub – SWE-Gym/SWE-Gym

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です