- Document-Level Text Simplification: Dataset, Criteria and Baseline [75.6]
文書レベルのテキスト単純化の新しいタスクを定義し,検討する。 Wikipediaダンプに基づいて、我々はまずD-Wikipediaという大規模なデータセットを構築した。 本稿では,文書レベルの単純化作業に適したD-SARIと呼ばれる新しい自動評価指標を提案する。
論文 参考訳(メタデータ) 参考訳(全文) (Mon, 11 Oct 2021 08:15:31 GMT)- 文書を単純化(読みやすくする)タスクの提案。日本語だと(文単位ではなく)あるドキュメントを「やさしい日本語」にするタスクのイメージ。
- この研究ではシンプル英語版ウィキペディアをベースにデータセットを作成、ベースラインモデルを構築、人の評価に近い結果を示すD-SARIという新たなメトリックを提案している。
- リポジトリはhttps://github.com/RLSNLP/Document-level-text-simplificationとのことだが、現時点では404