2022年5月20日 – arXiv最新論文の紹介

Lifting the Curse of Multilinguality by Pre-training Modular Transformers [72.5]
多言語事前訓練されたモデルは、多言語間のパフォーマンスが低下する、多言語間の呪いに苦しむ。言語固有のモジュールを導入し、言語定数当たりのトレーニング可能なパラメータの総数を保ちながら、モデルの総容量を拡大できるようにします。我々のアプローチは、測定可能な性能低下のないポストホック言語の追加を可能にし、モデルの使用を事前訓練された言語セットに制限しない。
論文参考訳（メタデータ） (Thu, 12 May 2022 17:59:56 GMT)
- 事前学習時から言語固有のエリアを持っておくことにより、その後の多言語なfine tuningで高性能を達成
- リポジトリはfairseq/examples/xmod at main · facebookresearch/fairseq · GitHub

CoCoA-MT: A Dataset and Benchmark for Contrastive Controlled MT with Application to Formality [22.4]
敬語を扱う際には、特定の問題が生じる。間違った音や不整合音を使用するのは不適切とみなされることがある。ラベル付きコントラストデータを微調整することで,フォーマルさを制御するモデルが訓練できることを示す。
論文参考訳（メタデータ） (Mon, 9 May 2022 04:05:36 GMT)
- フォーマルさをコントロールする機械翻訳用データセット。日本が含まれている点が興味深い。
  - とても大事なタスクであると思う一方でそもそも違和感のある日本語文が存在する・・・本当に人間が訳したんやろうか・・・
- リポジトリはGitHub – amazon-research/contrastive-controlled-mt: Code and data for the IWSLT 2022 shared task on Formality Control for SLT

日: 2022年5月20日