SVGenius: Benchmarking LLMs in SVG Understanding, Editing and Generation
SVGenius: Benchmarking LLMs in SVG Understanding, Editing and Generation [46.5] SVGeniusは3つのプログレッシブディメンション(理解、編集、生成)にわたる2,377のクエリからなる総合ベンチマークである。 SVGeniusは、システマティックな複雑性層を持つ24のアプリケーションドメインの実際のデータに基づいて、8つのタスクカテゴリと18のメトリクスでモデルを評価する。 論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:58:57 GMT)
SVGを対象としたベンチマーク、「Evaluation of 22 models reveals that while proprietary models outperform open-source counterparts, all models degrade with increasing complexity, and reasoning- enhanced training proves more effective than pure scaling.」とのこと。