- CoCoA-MT: A Dataset and Benchmark for Contrastive Controlled MT with Application to Formality [22.4]
敬語を扱う際には、特定の問題が生じる。 間違った音や不整合音を使用するのは不適切とみなされることがある。 ラベル付きコントラストデータを微調整することで,フォーマルさを制御するモデルが訓練できることを示す。
論文 参考訳(メタデータ) (Mon, 9 May 2022 04:05:36 GMT)- フォーマルさをコントロールする機械翻訳用データセット。日本が含まれている点が興味深い。
- とても大事なタスクであると思う一方でそもそも違和感のある日本語文が存在する・・・本当に人間が訳したんやろうか・・・
- リポジトリはGitHub – amazon-research/contrastive-controlled-mt: Code and data for the IWSLT 2022 shared task on Formality Control for SLT
- フォーマルさをコントロールする機械翻訳用データセット。日本が含まれている点が興味深い。