DavarOCR

  • DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding [27.0]
    DavarOCRは、OCRとドキュメント理解タスクのためのオープンソースのツールボックスである。 DavarOCRは19の高度なアルゴリズムを実装し、9つのタスク形式をカバーする。
    論文  参考訳(メタデータ)   (Thu, 14 Jul 2022 06:54:47 GMT)
    • オープンなOCRツール。一般的な「Text Detection」「Text Recognition」だけでなく「Text Spotting」「Video Text Spotting」「Information Extraction」「Table Recognition」「Table Understanding」「Layout Recognition」「Reading Order Detection」「Named Entity Recognition」が含まれているのがすごい。
    • リポジトリはGitHub – hikopensource/DAVAR-Lab-OCR: OCR toolbox from Davar-Lab

DocCoder: ドキュメントを利用したコード生成

オノマトペデータセットと検出・認識・リンク

  • COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated Texts [47.5]
    日本語漫画におけるオノマトペのテキストからなる新しい漫画オノマトペデータセット(COO)を提供する。 COOは、非常に湾曲した、部分的に縮小したテキスト、任意に配置されたテキストなど、多くの任意のテキストを持っている。 我々は,オノマトペ領域を検出し,その意図した意味を捉えるために,テキスト検出,テキスト認識,リンク予測という3つのタスクを実行する。
    論文  参考訳(メタデータ)  参考訳(全文)  (Mon, 11 Jul 2022 07:39:35 GMT)