要約 – ページ 2 – arXiv最新論文の紹介

SummerTime: 要約のためのツールキット

SummerTime: Text Summarization Toolkit for Non-experts [23.0]
SummerTimeは、さまざまなモデル、データセット、評価メトリクスを含む、テキスト要約のための完全なツールキットである。 SummerTimeはNLP研究者向けに設計されたライブラリと統合されており、使いやすいAPIをユーザに提供する。
論文参考訳（メタデータ）参考訳（全文） (Sun, 29 Aug 2021 03:24:48 GMT)
- モデル、データセット、評価方法が入ったツールキット。Multi documentやQuery basedなものまでまとめて入るのは素晴らしいと思う。
  - モデル：
    - Single-doc: BartModel, LexRankModel, LongformerModel, PegasusModel, TextRankModel
    - Multi-doc: MultiDocJointModel, MultiDocSeparateModel
    - Dialogue-based: HMNetModel
    - Query-based:BM25SummModel, TFIDFSummModel
  - データセット： ArXiv, CNN/DM(3.0.0), MlsumDataset, Multi-News, SAMSum, Pubmedqa, QMSum, ScisummNet, SummScreen, XSum
  - 評価方法： BERT Score, BLEU, ROUGE
- リポジトリはhttps://github.com/yale-lily/summertime、Colabへのリンクがあってすぐに試せるのもありがたい。

EmailSum: Abstractive Email Thread Summarization [105.5]
我々は,メールスレッド要約(EmailSum)データセットを抽象化的に開発する。このデータセットには、人間による注釈付きショート(30ワード)と、2549のメールスレッドからなるロング(100ワード)のサマリーが含まれている。本研究は,現在の抽象的要約モデルの課題を明らかにするものである。
論文参考訳（メタデータ） (Fri, 30 Jul 2021 15:13:14 GMT)
メールスレッド要約のためのデータセットと様々なモデルの評価結果を報告した論文。Extractiveな要約手法、Abstractiveな要約手法の代表的なものに加え、ラベル無しデータを用いるSemi-supervisedな手法も試している。結果的にT5が良好な結果をしめしたとのこと（Semi-supervisedな手法が勝っている評価指標もある）
リポジトリはhttps://github.com/ZhangShiyue/EmailSum

CLIP-It! Language-Guided Video Summarization [96.7]
この作業では、一般的性とクエリにフォーカスしたビデオ要約に対処する単一のフレームワークであるCLIP-Itを導入する。本稿では,言語誘導型マルチモーダルトランスフォーマーを提案する。本モデルは教師なしの設定に拡張することができる。標準ビデオ要約データセット (tvsum と summe) とクエリ指向ビデオ要約データセット (qfvs) の両方において,ベースラインと先行作業とを有意差で上回っている。本手法は強い一般化能力を示すため,転送設定の大幅な改善を実現した。
論文参考訳（メタデータ）参考訳（全文） (Thu, 1 Jul 2021 17:59:27 GMT)
- ビデオの各フレームをキャプショニング、スコアリングしてフレームからキーショットを選択。エンコーディングにCLIPを利用すると優れた性能が出せるとのこと。
- コード等はhttps://medhini.github.io/clip_it/で（後日）確認可能。

TWAG: A Topic-Guided Wikipedia Abstract Generator [23.9]
Wikipediaの抽象生成は、webソースからwikipediaの要約を蒸留することを目的としており、マルチドキュメント要約技術を採用することで大きな成功を収めている。それまでの著作では、抽象概念を平易なテキストとみなしており、要約があるエンティティを説明し異なるトピックに分解できるという事実を無視している。本稿では,トピック情報を用いた2段階モデルTWAGを提案する。
論文参考訳（メタデータ） (Tue, 29 Jun 2021 07:42:08 GMT)
- パラグラフとそのトピック情報を用い、トピックに応じた要約をすることでWikiCatSum datasetにおいてBARTなどより優れた結果を出したとの報告。
- ソース等はhttps://github.com/THU-KEG/TWAGから参照可能。

BookSum: A Collection of Datasets for Long-form Narrative Summarization [42.3]
booksumは長文要約のためのデータセットのコレクションである。我々のデータセットは、小説、戯曲、物語などの文学分野の資料をカバーしています。
論文参考訳（メタデータ） (Tue, 18 May 2021 00:22:46 GMT)
- 既存の要約データセットにはスタイルやレイアウトなど強力なバイアス（ヒント？）が含まれていることが多い。この問題を解決するデータセットになっているとのこと。
- https://github.com/salesforce/booksum　にデータ等が公開されている。

Enhancing Scientific Papers Summarization with Citation Graph [78.7]
論文要約を引用グラフを利用して再定義し,引用グラフに基づく要約モデルCGSumを提案する。異なる領域の141Kの研究論文と661Kの引用関係を含む新たな科学論文要約データセットSemantic Scholar Network (SSN)を構築した。単純なアーキテクチャであっても, 事前学習モデルと比較して性能が向上することが示された。論文の内容をよりよく理解し、高品質な要約を生成するために引用グラフが重要であることも示唆した。
論文参考訳（メタデータ） (Wed, 7 Apr 2021 11:13:35 GMT)
- 単純な文書要約ではなく文章以外の情報（ここでは引用関係）を考慮した要約。文書間の関係考慮は現実問題でも重要。データセット、コードも公開してくれるとのこと。

MultiScene: A Large-scale Dataset and Benchmark for Multi-scene Recognition in Single Aerial Images [17.8]
我々は10万の高解像度空中画像からなるMultiSceneと呼ばれる大規模なデータセットを作成します。このようなイメージを手動でラベル付けするのは極めて困難なため、クラウドソーシングプラットフォーム(例えばOpenStreetMap (OSM))から低コストなアノテーションを利用した。ノイズに対応するため、14,000枚の画像を検査し、そのシーンラベルを補正し、MultiScene-Cleanというクリーンな注釈付き画像のサブセットを生成した。これにより、クリーンデータを用いたマルチシーン認識のためのディープネットワークの開発と評価が可能となる。
論文参考訳（メタデータ） (Wed, 7 Apr 2021 01:09:12 GMT)
- 大規模データセットということで採用。ノイズへの対応は苦労が多そう。