2021年7月21日 – arXiv最新論文の紹介

Image Fusion Transformer: Transformerを使ったイメージフュージョン

Image Fusion Transformer [75.7]
画像融合では、異なるセンサから得られた画像を融合して、情報強化された単一の画像を生成する。近年,画像融合のための有意義な特徴を符号化するために,最先端の手法で畳み込みニューラルネットワーク(CNN)が採用されている。我々は,画像融合トランスフォーマー (IFT) を提案する。
論文参考訳（メタデータ） (Mon, 19 Jul 2021 16:42:49 GMT)
- 複数の異なるデータソースからの画像を融合（イメージフュージョン）し情報量の多い一枚の画像にするタスクにおいて、Transformerを使い優れた性能が出せたとの報告。最近よく話題になる局所的な情報と長距離で関係する情報を組み合わせられる構造となっている。

VisDrone-CC2020：ドローンからの群衆カウンティングコンペティション

VisDrone-CC2020: The Vision Meets Drone Crowd Counting Challenge Results [186.5]
私たちは大規模なデータセットを収集し、Vision Meets Drone Crowd Counting Challenge (VisDrone-CC 2020)を組織します。収集されたデータセットは、トレーニング用の2460の画像と、テスト用の900の画像を含む3360の画像で構成されている。評価結果を詳細に分析し,課題を結論付ける。
論文参考訳（メタデータ） (Mon, 19 Jul 2021 11:48:29 GMT)
- VisDrone-CC 2020の結果報告。提案された14個のアルゴリズムを比較検証しておりこの分野の手法と性能を知るうえで良い資料。
- コンペティションのWEBSITEはhttp://aiskyeye.com/、2021も開催済みのよう。