Condor: Enhance LLM Alignment with Knowledge-Driven Data Synthesis and Refinement

  • Condor: Enhance LLM Alignment with Knowledge-Driven Data Synthesis and Refinement [41.9]
    本研究では,ワールドナレッジツリーと自己回帰リファインメントを組み込んだ2段階合成データ生成フレームワークであるCondorを導入し,高品質なSFTデータを大規模に生成する。 実験結果から,20Kコンドル生成サンプルのみを微調整したベースモデルでは,本モデルよりも優れた性能が得られた。
    論文  参考訳(メタデータ)   (Tue, 21 Jan 2025 16:44:12 GMT)
  • SFTのための合成データ構築手法の提案、World Knowledge Treeを用いるアプローチ。圧縮された知識を解凍、わかりやすく言葉にして学習させている感があって面白い。
  • リポジトリはGitHub – InternLM/Condor

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です