Multilingual Multimodalityのサーベイ

  • Multilingual Multimodality: A Taxonomical Survey of Datasets, Techniques, Challenges and Opportunities [10.7]
    マルチ言語とマルチモーダル(MultiX)ストリームの統合について検討する。 我々は、並列アノテーションで研究された言語、金または銀のデータを調べ、これらのモダリティと言語がモデリングにおいてどのように相互作用するかを理解する。 モデリングアプローチの長所と短所とともに、どのシナリオを確実に使用できるのかをよりよく理解するために、モデリングアプローチについて説明します。
    論文  参考訳(メタデータ)   (Sun, 30 Oct 2022 21:46:01 GMT)

TOKEN2VEC / DyG2Vec

  • 音声認識等で用いられる音素トークンの分離、動的グラフの表現学習に関する2vecシリーズ
  • token2vec: A Joint Self-Supervised Pre-training Framework Using Unpaired Speech and Text [65.0]
    token2vecは、音声の離散表現に基づく、未ペア音声とテキストのための新しい事前学習フレームワークである。 実験の結果、 token2vec は様々な音声のみの事前学習ベースラインよりも大幅に優れており、WER の相対的な減少率は17.7%である。
    論文  参考訳(メタデータ)   (Sun, 30 Oct 2022 06:38:19 GMT)
  • DyG2Vec: Representation Learning for Dynamic Graphs with Self-Supervision [30.7]
    動的グラフ上での表現学習のための効率的なモデルであるDyG2Vecを提案する。 DyG2Vecはウィンドウベースのメカニズムを使用してタスクに依存しないノード埋め込みを生成し、将来のインタラクションを予測する。 2つのSSL評価機構を適用して動的グラフに適用し、SSL事前トレーニングがより堅牢な時間ノード表現の学習に役立つことを示す。
    論文  参考訳(メタデータ)   (Sun, 30 Oct 2022 18:13:04 GMT)