2022年3月15日 – arXiv最新論文の紹介

LaPraDoR: Unsupervised Pretrained Dense Retriever for Zero-Shot Text Retrieval [55.1]
我々は、最近提案されたBEIRベンチマークで、9つのゼロショットテキスト検索タスクの18のデータセットを含むLaPraDoRを評価する。実験結果から,LaPraDoRは教師付き高密度検索モデルと比較して最先端の性能を達成した。
論文参考訳（メタデータ） (Fri, 11 Mar 2022 18:53:12 GMT)
- ゼロショットなtext retrievalモデル、BEIRでSoTAとのこと。
  - 略称は無理やり感がすごい。そしてこの手の話題では毎回BM25って優秀だなー思う。
- リポジトリはGitHub – JetRunner/LaPraDoR: 🦮 Code and pretrained models for Findings of ACL 2022 paper “LaPraDoR: Unsupervised Pretrained Dense Retriever for Zero-Shot Text Retrieval”

Faking Fake News for Real Fake News Detection: Propaganda-loaded Training Data Generation [105.2]
本稿では,人間が書いたフェイクニュースに近い記事を生成するための新しいフレームワークを提案する。そして、私たちはプロパガンダのテクニックを、人間が偽ニュースを作る方法を模倣するために生成した記事に明示的に組み入れます。 PropaNewsでトレーニングされた検出器は、最先端のアプローチによって生成されたデータに基づいてトレーニングされた検出器よりも、人間の書き起こした偽情報を検出する精度が7.3%から12.0%高いことを示す。
論文参考訳（メタデータ）参考訳（全文） (Thu, 10 Mar 2022 14:24:19 GMT)
- Fake Newsを自動生成して検出器の性能を上げるという報告。人が書いたフェイクニュースのテクニックとして「主張の大半が本物（虚偽の主張は極一部）」のようなものが挙げられている。アプローチも「重要な文を特定」→「文脈に合わせて虚偽の文に置き換え」→「プロパガンダの記載」と良くも悪くも納得感がある。
- データセット等は公開予定とのこと。

日: 2022年3月15日