An Empirical Study on Challenging Math Problem Solving with GPT-4
An Empirical Study on Challenging Math Problem Solving with GPT-4 [35.5] この研究は、より複雑で挑戦的な数学問題の解決にGPT-4を使うことのフロンティアを探求する。 本研究で新たに提案された会話型問題解決フレームワークであるMathChatを提案する。 我々は,MATHデータセットを用いて,難易度の高い高校競争問題の評価を行う。 論文参考訳(メタデータ) (Thu, 8 Jun 2023 02:34:35 GMT)
ユーザプロキシーエージェントと会話しながら数学的な問題を解くフレームワークの提案。Program of ThoughtsやProgram Synthesis promptingを超える性能とのこと。
Evaluating and Improving Tool-Augmented Computation-Intensive Math Reasoning [75.7] CoT(Chain-of- Thought prompting)とツール拡張は、大きな言語モデルを改善するための効果的なプラクティスとして検証されている。 ツールインターフェース,すなわち DELI を用いた推論ステップを考慮に入れた新しい手法を提案する。 CARPと他の6つのデータセットの実験結果から、提案されたDELIは、主に競合ベースラインを上回っていることが示された。 論文参考訳(メタデータ) (Sun, 4 Jun 2023 17:02:59 GMT)