How Numerical Precision Affects Mathematical Reasoning Capabilities of LLMs
How Numerical Precision Affects Mathematical Reasoning Capabilities of LLMs [69.6] 本稿では,変圧器を用いた大規模言語モデルの数学的タスクにおける有効性に影響を与える重要な要因として,数値的精度を同定する。 その結果,数値精度の低いトランスフォーマーでは,繰り返し加算や整数乗算などの算術的なタスクに対処できないことがわかった。 対照的に、標準的な数値精度のトランスフォーマーは、モデルサイズを大幅に小さくすることで、これらのタスクを効率的に処理することができる。 論文参考訳(メタデータ) (Thu, 17 Oct 2024 17:59:35 GMT)
「Our results show that Transformers operating with low numerical precision fail to address arithmetic tasks, such as iterated addition and integer multiplication, unless the model size grows super-polynomially with respect to the input length.」という指摘。