2021年12月3日 – arXiv最新論文の紹介

Donut: OCRを用いないドキュメント理解

Donut: Document Understanding Transformer without OCR [17.4]
我々は,OCRフレームワークを基盤にすることなく,エンドツーエンドのトレーニングが可能な新しいVDUモデルを提案する。提案手法は,公開ベンチマークデータセットとプライベート産業サービスデータセットの各種文書理解タスクにおける最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 30 Nov 2021 18:55:19 GMT)
- OCRを用いないドキュメント理解手法の提案。レシート読み取りタスクにおいてend to endででOCR→BERTより大幅に優れているのは驚き。

Metaverceと芸術のサーベイ

When Creators Meet the Metaverse: A Survey on Computational Arts [19.4]
本論では, 仮想現実をブレンドした新しいアートワークについて, 計算芸術に関する包括的調査を行う。メタバースサイバースペースの拡張された地平線における斬新な創造のいくつかの顕著なタイプが反映されている。計算芸術の民主化,デジタルプライバシ,メタバースアーティストの安全,デジタルアートの所有権認識,技術的課題など,いくつかの研究課題を提案する。
論文参考訳（メタデータ） (Fri, 26 Nov 2021 13:24:37 GMT)
- 仮想現実とアートに関するサーベイ。読み物としても非常に面白く刺激的。