- MinerU: An Open-Source Solution for Precise Document Content Extraction [63.0]
MinerUは、高精度な文書コンテンツ抽出のためのオープンソースのソリューションである。 我々は、MinerUが、様々なドキュメントタイプで一貫してハイパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (Fri, 27 Sep 2024 15:35:15 GMT) - 強力なコンテンツ抽出フレームワークの提案。パイプライン構成及び構成要素のチューニングなども参考になる。「Additionally, we will introduce new models, such as table recognition and reading order, to enhance MinerU’s overall capabilities.」とある通り、順番認識は意外と難しい。ちょうど下記「Modeling Layout Reading Order as Ordering Relations for Visually-rich Document Understanding」論文が出ていた。
- リポジトリはGitHub – opendatalab/MinerU: A one-stop, open-source, high-quality data extraction tool, supports PDF/webpage/e-book extraction.一站式开源高质量数据提取工具,支持PDF/网页/多格式电子书提取。
- Modeling Layout Reading Order as Ordering Relations for Visually-rich Document Understanding [34.0]
本稿では,レイアウト要素の集合上の順序関係としてレイアウト読み込み順序をモデル化する。 レイアウト読み出し順序の改善型の導入による実用的利点を強調するため, 読み出し順序対応型パイプラインを提案する。
論文 参考訳(メタデータ) (Sun, 29 Sep 2024 12:00:57 GMT) - リポジトリは https://github.com/chongzhangFDU/ROOR とのことだが現時点では404