2021年10月28日 – arXiv最新論文の紹介

Multi-document Summarization: サブグラフ選択として解くSgSum、Longformerを用いるPRIMER

SgSum: Transforming Multi-document Summarization into Sub-graph Selection [27.4]
既存の抽出多文書要約(MDS)手法は、各文を個別にスコアし、一つずつ有能な文を抽出して要約を構成する。サブグラフ選択問題としてMDSタスクを定式化する新しいMDSフレームワーク(SgSum)を提案する。我々のモデルは従来のMDS法と比較して、より一貫性があり、情報的な要約を生成できる。
論文参考訳（メタデータ）参考訳（全文） (Mon, 25 Oct 2021 05:12:10 GMT)
- グラフ構造を通してMulti-documentな要約を行う手法の提案。MultiNewsやDUC2004で優れた結果。
- リポジトリはhttps://github.com/PaddlePaddle/Research/tree/master/NLP/EMNLP2021-SgSumとのこと（現時点では404）

PRIMER: Pyramid-based Masked Sentence Pre-training for Multi-document Summarization [16.8]
要約に着目した多文書表現のための事前学習モデルであるPRIMERを提案する。具体的には,マルチドキュメント入力に適した適切な入力変換とグローバルアテンションを備えたLongformerアーキテクチャを採用する。私たちのモデルであるPRIMERは、これらのほとんどの設定において、現在の最先端モデルを大きなマージンで上回る。
論文参考訳（メタデータ）参考訳（全文） (Sat, 16 Oct 2021 07:22:24 GMT)
- こちらはグラフ構造ではなくLongformerを用いてマルチドキュメントに対処するアプローチ、MultiNewsなどでSoTA。
- リポジトリはhttps://github.com/allenai/PRIMER

CoVA: Context-aware Visual Attention for Webpage Information Extraction [65.1]
WIE をコンテキスト対応 Web ページオブジェクト検出タスクとして再構築することを提案する。我々は、外観特徴とDOMツリーからの構文構造を組み合わせた、コンテキスト認識型視覚意図ベース(CoVA)検出パイプラインを開発した。提案手法は,従来の最先端手法を改良した新しい挑戦的ベースラインであることを示す。
論文参考訳（メタデータ） (Sun, 24 Oct 2021 00:21:46 GMT)
- WEBからの情報抽出にDOMを使うのではなくレンダリングされたWEBページにOCRを適用するというアプローチの論文。408サイト、7.7kのページ（のスクリーンショット）にアノテーションを行いモデル構築を実施。データセットも公開されている。
  - 人間的というか力業的というか悩ましいが、性能向上効果があるのであれば汎用的なアプローチであると思う。
- リポジトリはhttps://github.com/kevalmorabia97/cova-web-object-detection

PhoMT: A High-Quality and Large-Scale Benchmark Dataset for Vietnamese-English Machine Translation [7.0]
3.02M文対のベトナム語-英語並列データセットを高品質かつ大規模に導入する。これはベトナム語と英語の機械翻訳コーパスIWSLT15より2.9M大きい。自動・人両方の評価において、事前訓練されたシーケンス・ツー・シーケンス・デノナイズ・オートエンコーダmBARTを微調整することにより、最高の性能が得られる。
論文参考訳（メタデータ） (Sat, 23 Oct 2021 11:42:01 GMT)
- 3Mの対訳ペアからなるベトナム語-英語のパラレルコーパスの提案。Google Translateを用いた対訳ペアアライメントやフィルタリングの方法などが興味深い。mBARTを用いて機械翻訳で優れた性能を出せたとのことだが、Google TranslateやBing Translatorの比較ではドメイン外データの結果が気になるところ。
- リポジトリはhttps://github.com/VinAIResearch/PhoMTとのことだが、現時点では404

Human-Centered Explainable AI (XAI): From Algorithms to User Experiences [29.1]
説明可能なAI(XAI)は近年,膨大なアルゴリズムコレクションを生み出している。分野は学際的視点と人間中心のアプローチを受け入れ始めている。
論文参考訳（メタデータ）参考訳（全文） (Wed, 20 Oct 2021 21:33:46 GMT)
- XAIでもヒューマン・コンピュータ・インタラクション(HCI)、ユーザ・エクスペリエンス(UX)の設計が重要になっており、techno-centricなアプローチには落とし穴があるとの指摘。現状と限界を知るために良い資料との印象。