コンテンツへスキップ
- Mamba-3: Improved Sequence Modeling using State Space Principles [74.4]
線形モデルの状態空間モデル(SSM)の視点に触発された3つの中核的方法論的改善を紹介する。 アーキテクチャの改良とともに、Mamba-3モデルは、検索、状態追跡、下流言語モデリングタスク間で大きな進歩を遂げます。
論文 参考訳(メタデータ) (Mon, 16 Mar 2026 17:30:08 GMT)
- 「We combine: (1) a more expressive recurrence derived from SSM discretization, (2) a complex-valued state update rule that enables richer state tracking, and (3) a multi-input, multi-output (MIMO) formulation for better model performance without increasing decode latency.」、「At 1.5B scale, Mamba-3 (MIMO) improves downstream language modeling accuracy by +2.2 over Transformers, +1.9 points over Mamba-2, and +1.8 over GDN, while Mamba-3 (SISO) improves over the next best model, GDN, by +0.6 points.」とMambaの最新版。フロンティアモデルではTransformerと状態空間モデルのハイブリッド構成が多く、期待大。
- When AI Navigates the Fog of War [23.9]
我々は、現在のフロンティアモデルのトレーニング遮断後に展開された2026年の中東紛争の初期段階について研究する。 我々は,11の臨界時間ノード,42のノード固有の検証可能な質問,および5つの一般探索質問を構築した。 この研究は、拡大する地政学的危機において、モデル推論のアーカイブスナップショットとして機能する。
論文 参考訳(メタデータ) (Tue, 17 Mar 2026 15:13:10 GMT)
- 「Our analysis suggests three main takeaways. First, model responses often show strong strategic reasoning, going beyond surface rhetoric to attend to structural incentives, particularly in settings involving military posture, deterrence, and material constraints. Second, this capability is uneven across domains: models are generally more reliable in economically and logistically structured settings than in politically ambiguous multi-actor environments. Third, their narratives evolve over time, shifting from early expectations of rapid containment toward more systemic accounts of escalation, exhaustion, and fragile de-escalation.」との主張。
- 進行中の事象であり振り返るのは必須なのだろうが、進行中の状況であるがゆえに残しておく報告でもあると思う。