モデル説明の評価: 説明を用いてモデルのラベルを変更できるか？

Explain, Edit, and Understand: Rethinking User Study Design for Evaluating Model Explanations [97.9]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文参考訳（メタデータ） (Fri, 17 Dec 2021 18:29:56 GMT)
- 偽のホテルレビューか否かを判定するモデルに対し説明手法を適用、そのモデルを騙す（ラベルを変化させる）事に資するかをもって説明手法を評価する研究。BERTに対する説明ではLIMEなど局所説明は役に立たず、BERTを模倣するよう構築された線形モデル（学生モデル）が効果的だったとのこと。
- コード等は公開予定とのことだが、現状では404

コメントを残す

コメントを残す コメントをキャンセル