Agent Learning via Early Experience 

  • Agent Learning via Early Experience [93.8]
    言語エージェントの長期的な目標は、彼ら自身の経験から学び、改善することであり、最終的には複雑な現実世界のタスクにおいて人間より優れています。 現在のエージェントのほとんどは、専門家データによる教師付き微調整に依存しており、スケールと一般化が不十分である。 本研究では,(1)環境力学における政策の基盤として収集された状態を利用するインプリシット・ワールド・モデリング,(2)エージェントが最適な行動から学習し,推論と意思決定を改善するための自己回帰という2つの手法について検討する。
    論文  参考訳(メタデータ)   (Thu, 09 Oct 2025 17:59:17 GMT)
  • 「We address this limitation with a middle-ground paradigm we call early experience: interaction data generated by the agent’s own actions, where the resulting future states serve as supervision without reward signals. Within this paradigm we study two strategies of using such data: (1) Implicit world modeling, which uses collected states to ground the policy in environment dynamics; and (2) Self-reflection, where the agent learns from its suboptimal actions to improve reasoning and decision-making.」とSFTに代わるトレーニング手法を提案。

LLM/Agent-as-Data-Analyst: A Survey

  • LLM/Agent-as-Data-Analyst: A Survey [51.2]
    大規模言語モデル(LLM)とデータ分析のためのエージェント技術は、学術と産業の両方に大きな影響を与えている。 この技術進化は、インテリジェントなデータ分析エージェントのための5つの重要な設計目標、すなわちセマンティック・アウェア・デザイン、ハイブリッド統合、自律パイプライン、ツールの拡張されたモダリティ、オープンワールドタスクのサポートをさらに強化する。
    論文  参考訳(メタデータ)   (Sun, 28 Sep 2025 17:31:38 GMT)
  • データ分析のためのエージェントに関するサーベイ
  • リポジトリも用意されている GitHub – weAIDB/awesome-data-llm: Official Repository of “LLM × DATA” Survey Paper