Sabi\’a: Portuguese Large Language Models – arXiv最新論文の紹介

Sabi\’a: Portuguese Large Language Models [5.0]
対象言語における単言語事前学習は,すでに多種多様なコーパスで訓練されているモデルを大幅に改善することを示した。ポルトガルの14のデータセットからなるスイートであるPoetaに関するわずかな評価によると、我々のモデルは、英語と多言語で比較すると、かなり差がある。
論文参考訳（メタデータ） (Sun, 16 Apr 2023 20:11:19 GMT)
マルチリンガルモデルを単言語コーパスで継続的に事前学習することで当該言語での性能を大幅に向上できるという報告
ベースラインモデルの計算量の3%程度で相当の性能向上、LLaMA 65Bを使った場合はgpt-3.5-turboに匹敵ととても効果的に見える。
日本語でも同じようなことができるのか興味津々（もっとも個人で再現させるにはちょっと高いが）

コメントを残す

コメントを残す コメントをキャンセル