Global PIQA: Evaluating Physical Commonsense Reasoning Across 100+ Languages and Cultures
Global PIQA: Evaluating Physical Commonsense Reasoning Across 100+ Languages and Cultures [118.0] 我々は100以上の言語を対象とした参加型コモンセンス推論ベンチマークであるGlobal PIQAを提案する。 グローバルPIQAの116の言語変種は、5つの大陸、14の言語族、23の文字体系をカバーしている。 グローバルPIQAの非並列分割では、50%以上の例が地元の食品、習慣、伝統、その他の文化的特有な要素を参照している。 論文参考訳(メタデータ) (Tue, 28 Oct 2025 05:46:25 GMT)
「we have presented Global PIQA, a physical commonsense reasoning benchmark covering 116 language varieties. Unlike previous benchmarks, Global PIQA is a participatory benchmark, constructed by hand by 335 researchers across 65 countries.」とマルチリンガルなベンチマーク。