SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models
SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models [48.3] 本稿では,タンパク質基盤モデル用に設計された最初のレッドチームフレームワークであるSafeProteinを紹介する。 SafeProteinはマルチモーダルプロンプトエンジニアリングを組み合わせ、ビームサーチを生成して、レッドチーム方式を体系的に設計する。 また、手動で構築したレッドチームベンチマークデータセットと包括的な評価プロトコルを含むSafeProtein-Benchをキュレートした。 論文参考訳(メタデータ) (Wed, 03 Sep 2025 17:13:56 GMT)
「• SafeProtein: the first systematic red-teaming approach for protein foundation models, combining multimodal prompt engineering with heuristic beam search, achieving up to a 70% jailbreak success rate against the latest ESM3 model.」というフレームワークと、関連するベンチマークの紹介。