Are All the Datasets in Benchmark Necessary? A Pilot Study of Dataset Evaluation for Text Classification [39.0] 本稿では,ベンチマーク中のデータセットがすべて必要かどうかについて検討する。 9つのデータセットと36のシステムでの実験では、いくつかの既存のベンチマークデータセットはトップスコアシステムの識別にはほとんど寄与していない。 論文参考訳(メタデータ)参考訳(全文) (Wed, 4 May 2022 15:33:00 GMT)
WebFace260M: A Benchmark for Million-Scale Deep Face Recognition [89.4] 我々は、未修正4MのID/260Mの顔(WebFace260M)とクリーン2MのID/42Mの顔(WebFace42M)を含む新しい100万スケールの認識ベンチマークに貢献する。 分散フレームワークは、性能を損なうことなく、顔認識モデルを効率的に訓練するために開発された。 提案したベンチマークは、標準、マスク付き、偏見のない顔認識シナリオにおいて大きな可能性を示している。 論文参考訳(メタデータ)参考訳(全文) (Thu, 21 Apr 2022 14:56:53 GMT)
SciNLI: A Corpus for Natural Language Inference on Scientific Text [47.3] 我々は,NLIのための大規模データセットであるSciNLIを紹介した。 我々の実験によると、SciNLIは既存のNLIデータセットよりも分類が難しい。 論文参考訳(メタデータ) (Sun, 13 Mar 2022 18:23:37 GMT)
Towards Identifying Social Bias in Dialog Systems: Frame, Datasets, and Benchmarks [95.3] 本稿では,ダイアログの安全性問題に対する社会的バイアス検出に焦点をあてる。 まず,会話における社会的バイアスを現実的に分析する新しいダイアルバイアスフレームを提案する。 中国初の社会バイアスダイアログデータセットであるCDail-Biasデータセットを紹介する。 論文参考訳(メタデータ) (Wed, 16 Feb 2022 11:59:29 GMT)