Towards Execution-Grounded Automated AI Research

  • Towards Execution-Grounded Automated AI Research [106.9]
    現在のLLMはしばしばもっともらしく見えるが効果のないアイデアを生成します。実行基盤化は役に立つかもしれないが、自動実行が実現可能かどうか、LLMが実行フィードバックから学べるかどうかは不明だ。 我々は、アイデアを実装する自動化エグゼキュータを構築し、その有効性を検証するために大規模な並列GPU実験をローンチする。 本研究では,進化的探索と強化学習という,実行フィードバックから学習する2つの方法を分析する。
    論文  参考訳(メタデータ)   (Tue, 20 Jan 2026 22:35:44 GMT)
  • 「we develop a large-scale automated idea executor system that can implement research ideas for open-ended and realistic research problems. Using this automated executor, we conduct an in-depth analysis of how well LLM ideators can learn from execution feedback to improve effectiveness through evolutionary search and RL. Execution- guided evolutionary search is sample-efficient and effective, but shows limited scaling. RL from execution reward suffers from diversity collapse and does not improve the upperbound.」とのことで可能性とともに限界を感じる結果
  • リポジトリはGitHub – NoviScl/Automated-AI-Researcher

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です