- Ask Me Anything: A simple strategy for prompting language models [24.3]
大規模言語モデル(LLM)は、単にタスクの実行方法を示す自然言語プロンプトを与えられただけで、追加のトレーニングは行われない。本研究では,質問応答(QA)のプロンプトが,モデル出力を制限するプロンプトよりも優れていることを示す。 収集したプロンプトを適用して、入力の真のラベルに対していくつかのノイズの多い投票を行う。 プロンプトは、非常に異なる精度と複雑な依存関係を持つことができる。
論文 参考訳(メタデータ) (Thu, 6 Oct 2022 06:39:56 GMT)- タスクをQA方式に変換、複数の回答を束ねることで性能を向上。open-source のGPT-J-6B でfew-shotのGPT3-175Bを超える性能を出せるとのこと。
- リポジトリはHazyResearch/ama_prompting: Ask Me Anything language model prompting (github.com)