要約用(小説、戯曲、物語)のデータセット

  • BookSum: A Collection of Datasets for Long-form Narrative Summarization [42.3]
    booksumは長文要約のためのデータセットのコレクションである。 我々のデータセットは、小説、戯曲、物語などの文学分野の資料をカバーしています。
    論文  参考訳(メタデータ)   (Tue, 18 May 2021 00:22:46 GMT)
    • 既存の要約データセットにはスタイルやレイアウトなど強力なバイアス(ヒント?)が含まれていることが多い。この問題を解決するデータセットになっているとのこと。
    • https://github.com/salesforce/booksum にデータ等が公開されている。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です