MarkupLM: マークアップ情報を扱える言語モデル

  • MarkupLM: Pre-training of Text and Markup Language for Visually-rich Document Understanding [35.4]
    テキスト、レイアウト、画像によるマルチモーダル事前学習は、ビジュアルリッチ文書理解(VrDU)において大きな進歩を遂げた。 本稿では,マークアップ言語をバックボーンとする文書理解タスクのためのMarkupLMを提案する。 実験の結果,事前学習したMarkupLMは,複数の文書理解タスクにおいて,既存の強力なベースラインモデルよりも大幅に優れていた。
    論文  参考訳(メタデータ)   (Sat, 16 Oct 2021 09:17:28 GMT)
    • テキストだけでなくマークアップ情報を併用して事前学習を行う言語モデルの提案。文書理解タスクで既存の強力なベースラインモデルを大幅に上回るとのこと。この手のデータは削除してしまうことも多いが情報があることは間違いない。自然な形で利用、性能向上に効果があるのは面白い。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です