オープンなLLM（LLM-jp-13B）、Transparency Index、Llemma、Lemur

LLMを含むFoundationModelのTransparencyレポートが Stanford HAIから出ている。Introducing The Foundation Model Transparency Index (stanford.edu)。OSSのものが一番とは限らない意外な結果だが、各指標が同じ重さだというのに無理がありそう。。

今週も特化型を含めてLLMの発表が複数あった。

Llemma: An Open Language Model For Mathematics [48.3]
数学のための大きな言語モデルであるLlemmaを紹介します。 MATHベンチマークでは、Llemmaはすべての既知のオープンベースモデルより優れている。レムマは道具の使用と公式な定理を証明することができるが、それ以上の微調整は行わない。
論文参考訳（メタデータ） (Mon, 16 Oct 2023 17:54:07 GMT)
Code Llamaを継続学習し、数学の能力を強化したLLM
リポジトリはGitHub – EleutherAI/math-lm

Lemur: Harmonizing Natural Language and Code for Language Agents [107.4]
自然言語とコーディング機能の両方に最適化されたオープンソースの言語モデルであるLemurとLemur-Chatを紹介する。我々のモデルは、様々なテキストおよびコーディングベンチマークで最先端の平均性能を達成する。自然言語とプログラミング言語の調和により、Lemur-Chatはエージェント能力に関するプロプライエタリなモデルとのギャップを著しく狭めることができる。
論文参考訳（メタデータ） (Tue, 10 Oct 2023 17:57:45 GMT)
コード生成能力が高いLLM、70BはCC-BY-NCで商用利用はできない。
プロジェクトサイトはXLANG Lab | Introducing Lemur: Open Foundation Models for Language Agents
モデルはXLANG Lab | Introducing Lemur: Open Foundation Models for Language Agents、リポジトリはGitHub – OpenLemur/Lemur: Lemur: Open Foundation Models for Language Agents

コメントを残す コメントをキャンセル