敵対的攻撃 – arXiv最新論文の紹介

因果性を用いた敵対的攻撃対策

Adversarial Robustness through the Lens of Causality [105.5]
ディープニューラルネットワークの敵対的脆弱性は、機械学習において大きな注目を集めている。我々は、因果関係を敵対的脆弱性の軽減に組み込むことを提案する。我々の手法は、敵の脆弱性を緩和するために因果性を利用する最初の試みと見なすことができる。
論文参考訳（メタデータ） (Fri, 11 Jun 2021 06:55:02 GMT)
- 因果グラフを敵対的攻撃の防御に用いるという報告。敵対的攻撃は自然なデータ分布に対する特定の介入とみなせる、というのはその通りでベンチマーク上も効果があるのが興味深い。

テキスト生成と攻撃

Text Generation with Deep Variational GAN [16.3]
モード崩壊問題に対処するために,GANベースのジェネリックフレームワークを提案する。私たちのモデルは高い多様性で現実的なテキストを生成できることを示します。
論文参考訳（メタデータ） (Tue, 27 Apr 2021 21:42:13 GMT)
- GAN利用したテキスト生成。

Improved and Efficient Text Adversarial Attacks using Target Information [34.5]
ブラックボックス設定における自然言語モデルの逆例の研究への関心が高まっている。以前の高価な検索ではなく、解釈可能な学習によって単語のランク付けを学ぶ新しいアプローチが導入された。このアプローチを使用する主な利点は、最先端のメソッドに匹敵する攻撃率を達成できるが、高速でクエリが少ないことである。
論文参考訳（メタデータ） (Tue, 27 Apr 2021 21:25:55 GMT)
- 自然言語処理に対する攻撃、効率性が特徴。

GANを使ったXAI

Explaining in Style: Training a GAN to explain a classifier in StyleSpace [75.8]
本稿では,画像の意味的属性を説明するための生成モデルの学習法であるstylexを提案する。 StylExは、セマンティックとよく調和し、意味のある画像固有の説明を生成し、人間に解釈できる属性を見つけます。その結果,この手法はセマンティックとよく一致し,意味のある画像特異的な説明を生成し,人間と解釈できる属性を見出した。
論文参考訳（メタデータ） (Tue, 27 Apr 2021 17:57:19 GMT)
- GANを使って人が理解可能な説明をしようという研究。サンプル画像が興味深い。