NiuTrans: End-to-Endoの音声翻訳システム(IWSLT2021)

  • The NiuTrans End-to-End Speech Translation System for IWSLT 2021 Offline Task [23.0]
    本稿では,IWSLT 2021オフラインタスクに対して,NiuTransのエンドツーエンド音声翻訳システムを提案する。 我々はTransformerベースのモデルアーキテクチャを使用し、Conformer、相対位置符号化、スタックされた音響およびテキスト符号化により拡張する。 我々は MuST-C En-De テストセット上で 33.84 BLEU を達成する。
    論文  参考訳(メタデータ)   (Thu, 8 Jul 2021 08:21:18 GMT)
    • (様々なテクニックを使っているが)音声翻訳でもend-to-endなアプローチが優れた結果を出しているよう。

SSSE(Single-Step Sample Erasure): モデルからのデータ削除

  • SSSE: Efficiently Erasing Samples from Trained Machine Learning Models [103.4]
    サンプル消去のための効率的なアルゴリズムSSSEを提案する。 ある場合、SSSEは許可されたデータだけを用いて「スクラッチからモデルをトレーニングする最適だが実用的でない方法」と同様に、サンプルをほぼ消去することができる。
    論文  参考訳(メタデータ)   (Thu, 8 Jul 2021 14:17:24 GMT)
    • モデルから特定のデータポイントを削除する研究。GDPRの忘れられる権利の対応など、機械学習を社会で使っていくためには重要な技術。論文中でも書かれている通り、要請等に基づいて個人情報をデータベースから削除する場合、そのデータを使って作成したモデルからも当該情報を除く必要があるかははっきりしていないが、対応が必要な可能性はあると思う。
    • この手の研究でも評価指標が課題になっているよう。これまた論文中でも若干触れられているmembership inference attacks(メンバシップ推論攻撃)への耐性も気になるところ。