CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation 

  • CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation [51.7]
    カーネルの専門知識を3つのコンポーネントで開発する大規模なエージェント強化学習システムである。従来の方法に比べ、エージェントはスケーラブルなデータ合成パイプラインと自動検証環境を活用し、安定した訓練を実現した。KernelBenchの性能テストでは、torch.compileに対して最大40%の性能向上を達成。
    論文  参考訳(メタデータ)   (Fri, 27 Feb 2026 18:58:05 GMT)
  • 「We introduced CUDA Agent, a large-scale agentic reinforcement learning system that endows large language models with the ability to generate and optimize CUDA kernels under realistic, execution-driven development workflows. By jointly scaling data synthesis, agent environments, and stability-oriented RL training, CUDA Agent moves LLMs beyond syntactic code generation toward hardware-aware performance optimization, achieving consistent gains over torch.compile and strong proprietary models on KernelBench.」とのこと。ベースモデルはSeed1.6、ここまでやらないと・・・という点、Skillsで結合するような構成も興味深い。
  • プロジェクトサイトはCUDA Agent | Large-Scale Agentic RL for CUDA Kernel Generation

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です