Magistral – arXiv最新論文の紹介

Magistral [101.5]
私たちは、Mistralの最初の推論モデルであるMagistralと、当社独自のスケーラブルな強化学習パイプラインを紹介します。テキストデータだけでRLが初期チェックポイントの能力のほとんどを維持していることを示す。我々は、Mistral Medium 3上でRL単独で推論するために訓練されたMagistral Mediumを紹介し、Magistral Small(Apache 2.0)をオープンソース化した。
論文参考訳（メタデータ） (Thu, 12 Jun 2025 17:22:37 GMT)
MistralのLRM、「Eating the multimodal free lunch」は面白い。
24BのモデルはApache2ライセンスで公開されている。mistralai/Magistral-Small-2506 · Hugging Face

コメントを残す

コメントを残す コメントをキャンセル