- Incorporating Visual Layout Structures for Scientific Text Classification [31.2]
本研究では,VILA(Visual LAyout Structure)の新たな手法として,ページテキストをテキスト行やテキストブロックにグループ化する手法を言語モデルに導入する。 モデル入力にレイアウト構造の境界を示す特別なトークンを追加するI-VILAアプローチは、トークン分類タスクにおいて+14.5 F1のスコア改善をもたらす可能性があることを示す。
論文 参考訳(メタデータ) 参考訳(全文) (Tue, 1 Jun 2021 17:59:00 GMT)- レイアウト情報は重要な情報源であり、うまく活用できた時の効果は大きいと思う。
- データセットとコードはhttps://github.com/allenai/VILAで公開予定とのこと。