- UniCon: Unified Context Network for Robust Active Speaker Detection [111.9]
我々は、堅牢なアクティブ話者検出(ASD)のための新しい効率的なフレームワークUnified Context Network(UniCon)を導入する。 私たちのソリューションは、複数の種類のコンテキスト情報を共同でモデリングすることに焦点を当てた、新しく統合されたフレームワークです。 異なる設定下で、いくつかの挑戦的なASDベンチマークで徹底的なアブレーション研究が実施されている。
論文 参考訳(メタデータ) (Thu, 5 Aug 2021 13:25:44 GMT)- ビデオからの話者推定タスクAVA Challenge / Active Speaker (https://research.google.com/ava/challenge.html)でトップを取ったチームが出した論文。4ページの図を見ても高度なモデルの組み合わせで実現していることが分かる。
- プロジェクトサイトはhttps://unicon-asd.github.io/