プロンプトを使わないCoT – arXiv最新論文の紹介

Chain-of-Thought Reasoning Without Prompting [48.4]
CoT推論パスは、テキストデコーディングプロセスを変更するだけで、事前訓練されたLLMから引き出すことができる。我々は、デコードパスにおけるCoTの存在は、モデルのデコードされた回答に対する高い信頼と相関していることを観察する。
論文参考訳（メタデータ） (Thu, 15 Feb 2024 18:55:41 GMT)
「 there exists a task-agnostic way to elicit CoT reasoning from pre-trained LLMs by simply altering the decoding procedure.」という興味深い報告。デコーディング時の工夫は色々と改善の余地がありそうに思う。
デコーディングプロセスでの工夫は計算コストが高くなるなどどっちでやるべきなのかという話はある

コメントを残す

コメントを残す コメントをキャンセル