自然言語処理へのバックドアアタックと防御のサーベイ

A Survey on Backdoor Attack and Defense in Natural Language Processing [18.3]
NLP分野におけるバックドア攻撃と防御の総合的な検討を行う。ベンチマークデータセットを要約し、バックドア攻撃を防ぐために信頼できるシステムを設計するためのオープンな問題を指摘した。
論文参考訳（メタデータ） (Tue, 22 Nov 2022 02:35:12 GMT)
NLPにおける攻撃と防御のサーベイ
短めでざっくりと状況を知るのに良いサーベイ。自然言語一般かもしれないが、良いメトリクスが無いというのはつらいなーと思う（スコアリングモデル自体が攻撃対象になっているとめっちゃ大変そう）

コメントを残す

コメントを残す コメントをキャンセル