- BookSum: A Collection of Datasets for Long-form Narrative Summarization [42.3]
booksumは長文要約のためのデータセットのコレクションである。 我々のデータセットは、小説、戯曲、物語などの文学分野の資料をカバーしています。
論文 参考訳(メタデータ) (Tue, 18 May 2021 00:22:46 GMT)- 既存の要約データセットにはスタイルやレイアウトなど強力なバイアス(ヒント?)が含まれていることが多い。この問題を解決するデータセットになっているとのこと。
- https://github.com/salesforce/booksum にデータ等が公開されている。