OPT(Open Pre-trained Transformer): オープンな大規模言語モデル

OPT: Open Pre-trained Transformer Language Models [99.6]
125Mから175Bのパラメータからなるデコーダのみの事前学習トランスであるOpen Pre-trained Transformers (OPT)を提案する。 OPT-175BはGPT-3に匹敵するが, 炭素フットプリントの1/7しか必要としない。
論文参考訳（メタデータ）参考訳（全文） (Thu, 5 May 2022 11:44:30 GMT)
- GPT-3相当の規模を持つオープンな大規模言語モデル。Data card、Model cardともに論文中にあり、構築過程なども記載がある。
- リポジトリはmetaseq/projects/OPT at main · facebookresearch/metaseq · GitHub

コメントを残す

コメントを残す コメントをキャンセル