{"id":6035,"date":"2025-01-23T04:32:00","date_gmt":"2025-01-22T19:32:00","guid":{"rendered":"https:\/\/devneko.jp\/wordpress\/?p=6035"},"modified":"2025-01-23T04:32:00","modified_gmt":"2025-01-22T19:32:00","slug":"open-problems-in-machine-unlearning-for-ai-safety","status":"publish","type":"post","link":"https:\/\/devneko.jp\/wordpress\/?p=6035","title":{"rendered":"Open Problems in Machine Unlearning for AI Safety"},"content":{"rendered":"\n<ul class=\"wp-block-list\">\n<li><strong>Open Problems in Machine Unlearning for AI Safety\u00a0<\/strong>[61.4]<br>\u7279\u5b9a\u306e\u7a2e\u985e\u306e\u77e5\u8b58\u3092\u9078\u629e\u7684\u306b\u5fd8\u308c\u305f\u308a\u3001\u6291\u5727\u3057\u305f\u308a\u3059\u308b\u30de\u30b7\u30f3\u30a2\u30f3\u30e9\u30fc\u30cb\u30f3\u30b0\u306f\u3001\u30d7\u30e9\u30a4\u30d0\u30b7\u3068\u30c7\u30fc\u30bf\u524a\u9664\u30bf\u30b9\u30af\u306e\u7d04\u675f\u3092\u793a\u3057\u3066\u3044\u308b\u3002 \u672c\u7a3f\u3067\u306f,\u30a2\u30f3\u30e9\u30fc\u30cb\u30f3\u30b0\u304cAI\u5b89\u5168\u6027\u306e\u5305\u62ec\u7684\u30bd\u30ea\u30e5\u30fc\u30b7\u30e7\u30f3\u3068\u3057\u3066\u6a5f\u80fd\u3059\u308b\u3053\u3068\u3092\u9632\u6b62\u3059\u308b\u305f\u3081\u306e\u91cd\u8981\u306a\u5236\u7d04\u3092\u7279\u5b9a\u3059\u308b\u3002<br><a href=\"http:\/\/arxiv.org\/abs\/2501.04952v1\">\u8ad6\u6587<\/a>\u00a0\u00a0<a href=\"https:\/\/fugumt.com\/fugumt\/paper_check\/2501.04952v1\">\u53c2\u8003\u8a33\uff08\u30e1\u30bf\u30c7\u30fc\u30bf\uff09<\/a>\u00a0 \u00a0(Thu, 09 Jan 2025 03:59:10 GMT)<\/li>\n\n\n\n<li>\u91cd\u8981\u6280\u8853\u3067\u306f\u3042\u308b\u304c\u5b9f\u7528\u5316\u306b\u81f3\u3063\u3066\u3044\u306a\u3044\u96f0\u56f2\u6c17\u306e\u3042\u308bMachine unlearning\u306b\u95a2\u3059\u308b\u30b5\u30fc\u30d9\u30a4\u3002\u4e3b\u306b\u8ab2\u984c\u9762\u306b\u30d5\u30a9\u30fc\u30ab\u30b9\u3057\u3066\u3044\u308b\u3002<\/li>\n\n\n\n<li>\u7d50\u8ad6\u306e\u300cCurrent approaches to neural-level interventions often produce unintended effects on broader model capabilities, adding practical challenges to selective capability control, while the difficulty of verifying unlearning success and robustness against relearning raises additional concerns. Furthermore, unlearning interventions can create tensions with existing safety mechanisms, potentially affecting their reliability.\u300d\u306f\u73fe\u72b6\u3092\u7aef\u7684\u306b\u8868\u3057\u3066\u3044\u308b\u3002\u3002\u3002<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[387,426],"class_list":["post-6035","post","type-post","status-publish","format-standard","hentry","category-arxiv","tag-survey","tag-unlearning"],"_links":{"self":[{"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/6035","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=6035"}],"version-history":[{"count":0,"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/6035\/revisions"}],"wp:attachment":[{"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=6035"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=6035"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/devneko.jp\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=6035"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}