Current Agents Fail to Leverage World Model as Tool for Foresight

  • Current Agents Fail to Leverage World Model as Tool for Foresight [86.9]
    エージェントは、行動する前に結果を予測するためにそれらを使用できます。 本稿では,現在のエージェントがそのような世界モデルを,認知力を高めるツールとして活用できるかどうかを実証的に検討する。
    論文  参考訳(メタデータ)   (Wed, 07 Jan 2026 13:15:23 GMT)
  • 「Our investigation reveals that giving agents access to a world model reshapes their behavior in unexpected ways. Rather than serving as a straightforward enhancement, simulation introduces new cognitive pressures: agents must manage hypothetical branches and maintain coherent reasoning across mixed real and imagined experience. The difficulties we observe, including hesitation, over-analysis, and misaligned interpretation, suggest that effective foresight requires more fine-grained governance.」と、world model的なツールがあったとしても現在のAIはそれを使いこなせていないという指摘。
  • 現段階ではworld model的能力が考慮された設計になっていない、ということなんだろうか。

Driving on Registers 

  • Driving on Registers [95.3]
    DrivoRは、エンドツーエンドの自動運転のためのシンプルで効率的なトランスフォーマーベースのアーキテクチャである。 提案手法は、事前訓練された視覚変換器(ViT)上に構築され、マルチカメラ機能をコンパクトなシーン表現に圧縮するカメラ対応レジスタトークンを導入している。 この結果から,純変圧器アーキテクチャと目標トークン圧縮を組み合わせることで,高精度で適応的なエンド・ツー・エンド・ドライブを実現するのに十分であることが示唆された。
    論文  参考訳(メタデータ)   (Thu, 08 Jan 2026 16:28:24 GMT)
  • 自動運転のEnd-to-end (E2E) planning、「The proposed architecture is composed of three transformer blocks: one encoder (perception) and two decoders (trajectory and scoring). The perception encoder compresses perceptual information in camera-aware registers for lightweight subsequent processing in the trajectory and scoring decoders. The decoded trajectories are re-embedded and detached from the gradient computation graph to disentangle scoring and generation. The final trajectory is chosen from the proposal set via the max predicted score」とアーキテクチャも考え方はシンプルに見える。
  • プロジェクトサイトはDriving on Registers