SVGenius: Benchmarking LLMs in SVG Understanding, Editing and Generation 

  • SVGenius: Benchmarking LLMs in SVG Understanding, Editing and Generation [46.5]
    SVGeniusは3つのプログレッシブディメンション(理解、編集、生成)にわたる2,377のクエリからなる総合ベンチマークである。 SVGeniusは、システマティックな複雑性層を持つ24のアプリケーションドメインの実際のデータに基づいて、8つのタスクカテゴリと18のメトリクスでモデルを評価する。
    論文  参考訳(メタデータ)   (Tue, 03 Jun 2025 17:58:57 GMT)
  • SVGを対象としたベンチマーク、「Evaluation of 22 models reveals that while proprietary models outperform open-source counterparts, all models degrade with increasing complexity, and reasoning- enhanced training proves more effective than pure scaling.」とのこと。
  • リポジトリはSVGenius: Benchmarking LLMs in SVG Understanding, Editing and Generation

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です