CoCoA-MT: A Dataset and Benchmark for Contrastive Controlled MT with Application to Formality [22.4] 敬語を扱う際には、特定の問題が生じる。 間違った音や不整合音を使用するのは不適切とみなされることがある。 ラベル付きコントラストデータを微調整することで,フォーマルさを制御するモデルが訓練できることを示す。 論文参考訳(メタデータ) (Mon, 9 May 2022 04:05:36 GMT)
Are All the Datasets in Benchmark Necessary? A Pilot Study of Dataset Evaluation for Text Classification [39.0] 本稿では,ベンチマーク中のデータセットがすべて必要かどうかについて検討する。 9つのデータセットと36のシステムでの実験では、いくつかの既存のベンチマークデータセットはトップスコアシステムの識別にはほとんど寄与していない。 論文参考訳(メタデータ)参考訳(全文) (Wed, 4 May 2022 15:33:00 GMT)
WebFace260M: A Benchmark for Million-Scale Deep Face Recognition [89.4] 我々は、未修正4MのID/260Mの顔(WebFace260M)とクリーン2MのID/42Mの顔(WebFace42M)を含む新しい100万スケールの認識ベンチマークに貢献する。 分散フレームワークは、性能を損なうことなく、顔認識モデルを効率的に訓練するために開発された。 提案したベンチマークは、標準、マスク付き、偏見のない顔認識シナリオにおいて大きな可能性を示している。 論文参考訳(メタデータ)参考訳(全文) (Thu, 21 Apr 2022 14:56:53 GMT)
Summarization with Graphical Elements [55.6] 本稿では,グラフィカル要素による要約という新しい課題を提案する。 タスクの研究を支援するために,高品質なラベル付きデータセットを収集する。 論文参考訳(メタデータ) (Fri, 15 Apr 2022 17:16:41 GMT)
ナレッジグラフのような形で要約する新しい要約タスクの提案とデータセット、ベースモデルの提示。提案されたデータセットでは関係として「L = {who, what, what happens, what happened, what will happen, where, when, why}」が与えられており、このような関係で結ばれた小さな要約で構成されていると確かに読みやすい。
EntSUM: A Data Set for Entity-Centric Summarization [27.8] 制御可能な要約は、ユーザが指定した側面や好みを考慮に入れた要約を提供することを目的としている。 本稿では、制御可能な要約のための人間アノテーション付きデータセットEntSUMを紹介し、制御の側面として名前付きエンティティに焦点を当てる。 論文参考訳(メタデータ) (Tue, 5 Apr 2022 13:45:54 GMT)