- S*: Test Time Scaling for Code Generation [55.1]
コード生成のための最初のハイブリッドテストタイムスケーリングフレームワークであるS*を提案する。 S*は生成されたコードのカバレッジと選択精度を大幅に改善する。
論文 参考訳(メタデータ) (Thu, 20 Feb 2025 09:18:53 GMT) - Sky-T1(Deepseek R1、Sky-T1、TinyZero、Kimi k1.5 – arXiv最新論文の紹介)チームによるコード生成領域のtest time scalingフレームワークの提案。「Increasing test-time compute for LLMs shows promise across domains but remains underexplored in code generation, despite extensive study in math.」は本間かいなと思うものの、コードが公開されるのはありがたい。
- リポジトリはGitHub – NovaSky-AI/SkyThought: Sky-T1: Train your own O1 preview model within $450