2021年10月18日 – arXiv最新論文の紹介

General Language Modelsからのナレッジグラフ作成

Symbolic Knowledge Distillation: from General Language Models to Commonsense Models [38.3]
一般的な言語モデルは、コモンセンスモデルを訓練するための知識グラフを作成できる。ニューラルモデルに加えて、記号的にテキストとして知識を蒸留する。人間が作成したコモンセンス知識グラフが、私たちの自動蒸留変種に取って代わられるのは初めてです。
論文参考訳（メタデータ）参考訳（全文） (Thu, 14 Oct 2021 06:50:19 GMT)
- GPT-3からデータを抽出、フィルタリング等により高品質化してGLMからのナレッジグラフを作成。量・質・多様性の観点で人が作成したものを上回り、元のGPT-3を上回るモデルが構築できたとのこと。「Machines can now win over humans for automatic knowledge graph construction.」というfindingsは興味深い。
- リポジトリはhttps://github.com/peterwestai2/symbolic-knowledge-distillation

SpeechT5: Unified-Modal Encoder-Decoder Pre-training for Spoken Language Processing [77.5]
本稿では,自己教師付き音声/テキスト表現学習のためのエンコーダ・デコーダ事前学習を探索する統一モーダルなSpeechT5フレームワークを提案する。 SpeechT5フレームワークは共有エンコーダデコーダネットワークと6つのモーダル固有(音声/テキスト)プレ/ポストネットで構成されている。テキスト情報と音声情報を統一的な意味空間に整合させるため,テキストとテキストをランダムに混合したクロスモーダルベクトル量子化法を提案する。
論文参考訳（メタデータ） (Thu, 14 Oct 2021 07:59:27 GMT)
- T5に似た事前学習モデルを音声向けに構築、ASR、TTS、VC、SIDなど複数のタスクで効果を確認とのこと。TextlessNLPのような流れに向けた一歩になるのだろうか。
  - ASR: Automatic Speech Recognition
  - TTS: Text-To-Speech
  - VC: Voice Conversion
  - SID: Speaker IDentiﬁcation

Cross-Lingual GenQA: A Language-Agnostic Generative Question Answering Approach for Open-Domain Question Answering [77.0]
オープン検索生成質問回答(GenQA)は、高品質で自然な回答を英語で提供することが証明されている。我々は多言語環境に対するGenQAアプローチの最初の一般化について述べる。
論文参考訳（メタデータ） (Thu, 14 Oct 2021 04:36:29 GMT)
- 複数の言語で一般的な質問に回答可能なモデルの提案。単言語のモデル：MONOLINGUAL GENQA、多言語のモデル：MULTILINGUAL GENQA、複数言語の回答を合成するCROSSLINGUAL GENQAを比較、単言語モデルよりも優れている場合があることを示している。
  - 言語間差異が大きく興味深い実験・結果だが（論文中にも指摘がある通り）途中に機械翻訳を挟んだ影響が気になる。
- リポジトリはhttps://github.com/alexa/wqa-cascade-transformers/tree/master/arxiv2021mgqa