Model Editing Can Hurt General Abilities of Large Language Models

  • Model Editing Can Hurt General Abilities of Large Language Models [128.3]
    大規模言語モデル(LLM)は、パラメータに格納された知識にアクセスするための新しいパラダイムを開放した。 大規模言語モデル(LLM)の最近の進歩は、パラメータに格納された知識にアクセスするための新しいパラダイムを開放した。 更新情報によるLLMの再学習は資源集約的であるため,モデル編集への関心が高まっている。
    論文  参考訳(メタデータ)   (Tue, 9 Jan 2024 18:03:15 GMT)
  • モデル編集の副作用に関する検証、GPT2-XLとLlama-1-7Bを対象にKN、MEND、ROME、MEMITでModel Editingし、8タスクで評価。結果として性能はかなり劣化したとのこと。
  • 結果としては納得感があり、これら技術を使うには当該分野のテスト方法を確立する必要がありそう。
  • リポジトリはJasonForJoy/Model-Editing-Hurt (github.com)