Omnilingual MT: Machine Translation for 1,600 Languages
Omnilingual MT: Machine Translation for 1,600 Languages [58.7] 我々は,1600以上の言語をサポートする最初の機械翻訳システムであるOmnilingual Machine Translation (OMT)を提案する。 このスケールは、大規模な公開多言語コーパスと新たに作成されたデータセットを統合する包括的なデータ戦略によって実現されている。 OMTモデルは言語間移動を改善し、1,600の評価において、MTのパズルの「理解」部分を解くのに近づいている。 論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:25:51 GMT)
NLLBを超える1600言語に対応した翻訳モデル。
「BOUQuET dataset (a newly created, largest-to-date multilingual evaluation collection built from scratch and manually extended across a wide range of linguistic families)」によるリーダーボードが公開されている。Bouquet – a Hugging Face Space by facebook