Extract Information from Hybrid Long Documents Leveraging LLMs: A Framework and Dataset
Extract Information from Hybrid Long Documents Leveraging LLMs: A Framework and Dataset [52.3] 大規模言語モデル(LLM)は、テキストと表のデータを含むハイブリッドテキストを理解し解析することができる。 本研究では,LLMがHLD(Hybrid Long Document)を処理できるようにするための自動情報抽出フレームワーク(AIE)を提案し,HLDからの情報抽出の4つの重要な側面を分析する実験を行った。 HLDにおけるデータセット不足の問題に対処し、今後の作業を支援するために、金融レポート数値抽出(FINE)データセットを提案する。 論文参考訳(メタデータ) (Sat, 28 Dec 2024 07:54:14 GMT)
Automated Information Extraction (AIE) frameworkの提案、「AIE comprises four modules: Segmentation, Retrieval, Summarization, and Extraction.」と割と一般的な構成に見える