Unlabeledデータを用いたフィールド抽出モデル

  • Field Extraction from Forms with Unlabeled Data [53.9]
    本研究では,未ラベルデータを用いたフォームからフィールド抽出を行う新しいフレームワークを提案する。 我々は,未ラベル形式からノイズの多い擬似ラベルをマイニングするためのルールベース手法を開発した。
    論文  参考訳(メタデータ)  参考訳(全文)  (Fri, 8 Oct 2021 17:50:12 GMT)
    • ルールベースの手法で疑似ラベルを付与して学習、その後transformerベースの手法でモデルを改善していくという手法でField Extractionを行うという論文。現実的な対応という感じがして参考になる。論文で指摘されているようにセンシティブな情報が含まれていることも多いのでアノテーションを行わない(行うにしても少なくて済む)手法は重要。