Omnilingual MT: Machine Translation for 1,600 Languages 

  • Omnilingual MT: Machine Translation for 1,600 Languages [58.7]
    我々は,1600以上の言語をサポートする最初の機械翻訳システムであるOmnilingual Machine Translation (OMT)を提案する。 このスケールは、大規模な公開多言語コーパスと新たに作成されたデータセットを統合する包括的なデータ戦略によって実現されている。 OMTモデルは言語間移動を改善し、1,600の評価において、MTのパズルの「理解」部分を解くのに近づいている。
    論文  参考訳(メタデータ)   (Wed, 18 Mar 2026 16:25:51 GMT)
  • NLLBを超える1600言語に対応した翻訳モデル。
  • 「BOUQuET dataset (a newly created, largest-to-date multilingual evaluation collection built from scratch and manually extended across a wide range of linguistic families)」によるリーダーボードが公開されている。Bouquet – a Hugging Face Space by facebook