- 3D Question Answering [22.2]
VQA(Visual Question Answering)を3Dドメインに拡張する最初の試みを示す。 本稿では,新しい3DQAフレームワーク 3DQA-TR を提案する。 提案する3DQAフレームワークの有効性を検証するため,最初の3DQAデータセットScanQAを開発した。
論文 参考訳(メタデータ) (Wed, 15 Dec 2021 18:59:59 GMT)- ありそうでなかった3次元空間上のQAデータセットとそれを扱うフレームワークの提案。ScanNet | Richly-annotated 3D Reconstructions of Indoor Scenes (scan-net.org)の806シーンに対して6K質問、30K回答とそれなりの規模。
- データ等は公開予定とのこと。