SridBench: Benchmark of Scientific Research Illustration Drawing of Image Generation Model
SridBench: Benchmark of Scientific Research Illustration Drawing of Image Generation Model [21.8] SridBenchは、科学フィギュア生成のための最初のベンチマークである。 これは13の自然科学とコンピュータ科学の分野にわたる主要な科学論文から1,120の事例で構成されている。 その結果、GPT-4o画像のような最上位モデルでさえ、人間のパフォーマンスに遅れがあることが判明した。 論文参考訳(メタデータ) (Wed, 28 May 2025 08:51:01 GMT)
科学的な図の生成に関するベンチマーク作成とその検証。データは公開されていない?
「We found that, with the exception of GPT-4o-image, other image generation models, such as Gemini- 2.0-Flash, do not have any scientific mapping capabilities.」とのこと。。