ESPnet-ST-v2

  • ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit [61.5]
    ESPnet-ST-v2はオープンソースのESPnet-STツールキットを改良したものである。 本稿では,ESPnet-ST-v2の裏側における全体的な設計,各タスクのサンプルモデル,パフォーマンスベンチマークについて述べる。
    論文  参考訳(メタデータ)   (Tue, 11 Apr 2023 17:44:53 GMT)
  • ESPnetのバージョン2
  • GitHub – espnet/espnet: End-to-End Speech Processing Toolkit

NiuTrans: End-to-Endoの音声翻訳システム(IWSLT2021)

  • The NiuTrans End-to-End Speech Translation System for IWSLT 2021 Offline Task [23.0]
    本稿では,IWSLT 2021オフラインタスクに対して,NiuTransのエンドツーエンド音声翻訳システムを提案する。 我々はTransformerベースのモデルアーキテクチャを使用し、Conformer、相対位置符号化、スタックされた音響およびテキスト符号化により拡張する。 我々は MuST-C En-De テストセット上で 33.84 BLEU を達成する。
    論文  参考訳(メタデータ)   (Thu, 8 Jul 2021 08:21:18 GMT)
    • (様々なテクニックを使っているが)音声翻訳でもend-to-endなアプローチが優れた結果を出しているよう。