LM2: Large Memory Models – arXiv最新論文の紹介

LM2: Large Memory Models [11.3]
本稿では,補助メモリモジュールで拡張されたデコーダのみのトランスフォーマーアーキテクチャであるLarge Memory Model (LM2)を紹介する。 BABILongベンチマークの実験結果によると、LM2モデルはメモリ拡張RTTモデルとベースラインのLlama-3.2モデルの両方を平均86.3%上回っている。
論文参考訳（メタデータ） (Sun, 09 Feb 2025 22:11:42 GMT)
Large Memory Model (LM2)「decoder-only Transformer architecture enhanced with an auxiliary memory module」の提案。多くの人が待ち望んでいる拡張形態であり、実用的な規模（大規模）での検証でうまくいくか興味津々。
リポジトリはGitHub – convergence-ai/lm2: Official repo of paper LM2

コメントを残す

コメントを残す コメントをキャンセル