音声/画像によるAnomaly Event Detection

  • Audio-visual Representation Learning for Anomaly Events Detection in Crowds [119.7]
    本稿では,音声と視覚信号の同時モデリングにおけるマルチモーダル学習の活用を試みる。 監視シーンにおける合成音声視覚データセットであるSHADEデータセットについて実験を行った。 音声信号の導入は,異常事象の検出性能を効果的に向上し,他の最先端手法よりも優れることがわかった。
    論文  参考訳(メタデータ)  参考訳(全文)  (Thu, 28 Oct 2021 02:42:48 GMT)
    • 音声+画像による異常検知。直感的にも効果がありそう。複数の情報ソースを束ね高性能を目指すアプローチは今後も有望だと思う。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です