Multimodal Tree Decoder for Table of Contents Extraction in Document Images

  • Multimodal Tree Decoder for Table of Contents Extraction in Document Images [32.5]
    テーブル・オブ・コンテント(ToC)抽出は、文書の様々なレベルの見出しを抽出し、内容のアウトラインをよりよく理解することを目的としている。 まず,学術論文の650件の資料とコンテンツラベルによるイメージサンプルを含む,標準データセットであるHierDocを紹介した。 本稿では,ToCのマルチモーダルツリーデコーダ(MTD)をHierDocのベンチマークとして用いた新しいエンドツーエンドモデルを提案する。
    論文  参考訳(メタデータ)   (Tue, 6 Dec 2022 11:38:31 GMT)
  • Table of Contentsの自動生成モデルの開発。ベンチマーク用のデータセット作成も行っており、かつ、マルチモーダル。画像からの情報が多いというのは直感に反していない。
  • リポジトリはとのことだが、https://github.com/Pengfei-Hu/MTDまだ404

Training Data Influence Analysis and Estimation

  • Training Data Influence Analysis and Estimation: A Survey [11.7]
    トレーニングデータの影響分析と推定に関する総合的な調査を初めて実施する。 我々は、最先端の影響分析手法を分類学に編成する。 本研究では,影響分析をより効果的に活用するための今後の研究の方向性を提案する。
    論文  参考訳(メタデータ)   (Fri, 9 Dec 2022 00:32:46 GMT)
  • 学習データと予測に関係する様々な研究をサーベイしたもの。ビジネスではよく聞かれる&必要とされている分野ではあるが発展途上(理解しきれていない)分野でありそうとの感想。
  • リポジトリに論文リストがあってこちらも参考になる ZaydH/influence_analysis_papers: Influence Analysis and Estimation – Survey, Papers, and Taxonomy (github.com)