Text2Vis: A Challenging and Diverse Benchmark for Generating Multimodal Visualizations from Text
Text2Vis: A Challenging and Diverse Benchmark for Generating Multimodal Visualizations from Text [30.7] テキスト・ツー・ビジュアル化モデルを評価するためのベンチマークであるText2Visを紹介する。 1,985のサンプルからなり、それぞれにデータテーブル、自然言語クエリ、短い回答、視覚化コード、注釈付きチャートがある。 これは大きなパフォーマンスギャップを明らかにし、重要な課題を強調し、将来の進歩に対する洞察を提供する。 論文参考訳(メタデータ) (Sat, 26 Jul 2025 14:59:04 GMT)
「We introduce Text2Vis, a benchmark for evaluating LLMs in text-to-visualization tasks, featuring diverse datasets and over 20 chart types to support complex queries involving multi-step reasoning, retrieval, multi-chart generation, and conversations.」というベンチマークの提案。Agenticな処理フレームワークによって性能が向上とのこと。