A Survey on Long Text Modeling with Transformers [33.9] 本稿では,Transformerモデルに基づく長文モデリングの最近の進歩について概説する。 長さ制限を満たすために長い入力を処理し、改良されたTransformerアーキテクチャを設計する方法について論じる。 本稿では,長文モデリングに関わる4つの典型的な応用について述べるとともに,今後の方向性を議論する。 論文参考訳(メタデータ) (Tue, 28 Feb 2023 11:34:30 GMT)
SCROLLS: Standardized CompaRison Over Long Language Sequences [62.6] SCROLLSは長いテキストに対する推論を必要とするタスクのスイートである。 SCROLLSには要約、質問応答、自然言語推論タスクが含まれる。 すべてのデータセットを統一されたテキスト・ツー・テキスト形式で利用可能にし、モデルアーキテクチャと事前学習方法の研究を容易にするために、ライブのリーダーボードをホストします。 論文参考訳(メタデータ) (Mon, 10 Jan 2022 18:47:15 GMT)