INTEGRATED GRADIENT – arXiv最新論文の紹介

Perturbing Inputs for Fragile Interpretations in Deep Natural Language Processing [18.9]
解釈可能性の手法は、医療や金融などの高い分野における信頼できるNLPアプリケーションにとって堅牢である必要がある。本稿では,入力テキスト上で単純な単語摂動を行うことで,解釈がどのように操作できるかを示す。
論文参考訳（メタデータ） (Wed, 11 Aug 2021 02:07:21 GMT)
- 単語をスワップすることによってLIMEやINTEGRATED GRADIENTの解釈に影響を与えることができるかを検証した論文。解釈性へ影響を与えることが可能とのこと。
- 「there has been little analysis of the reliability and robustness of the explanation techniques」という指摘は重要。

タグ: INTEGRATED GRADIENT