オープンなLLM(LLM-jp-13B)、Transparency Index、Llemma、Lemur

130億パラメータの大規模言語モデル「LLM-jp-13B」を構築~NII主宰LLM勉強会(LLM-jp)の初期の成果をアカデミアや産業界の研究開発に資するために公開~ – 国立情報学研究所 / National Institute of Informatics
でApache-2の日本語対応(おそらく日英対応)LLMが発表された。ツール類も含めてオープンであり素晴らしい取り組み

LLMを含むFoundationModelのTransparencyレポートが Stanford HAIから出ている。Introducing The Foundation Model Transparency Index (stanford.edu)。OSSのものが一番とは限らない意外な結果だが、各指標が同じ重さだというのに無理がありそう。。

今週も特化型を含めてLLMの発表が複数あった。

  • Llemma: An Open Language Model For Mathematics [48.3]
    数学のための大きな言語モデルであるLlemmaを紹介します。 MATHベンチマークでは、Llemmaはすべての既知のオープンベースモデルより優れている。 レムマは道具の使用と公式な定理を証明することができるが、それ以上の微調整は行わない。
    論文  参考訳(メタデータ)   (Mon, 16 Oct 2023 17:54:07 GMT)
  • Code Llamaを継続学習し、数学の能力を強化したLLM
  • リポジトリはGitHub – EleutherAI/math-lm

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です