SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models 

  • SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models [48.3]
    本稿では,タンパク質基盤モデル用に設計された最初のレッドチームフレームワークであるSafeProteinを紹介する。 SafeProteinはマルチモーダルプロンプトエンジニアリングを組み合わせ、ビームサーチを生成して、レッドチーム方式を体系的に設計する。 また、手動で構築したレッドチームベンチマークデータセットと包括的な評価プロトコルを含むSafeProtein-Benchをキュレートした。
    論文  参考訳(メタデータ)   (Wed, 03 Sep 2025 17:13:56 GMT)
  • 「• SafeProtein: the first systematic red-teaming approach for protein foundation models, combining multimodal prompt engineering with heuristic beam search, achieving up to a 70% jailbreak success rate against the latest ESM3 model.」というフレームワークと、関連するベンチマークの紹介。
  • リポジトリはGitHub – jigang-fan/SafeProtein: Official Repository for SafeProtein and SafeProtein-Bench

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です