Prompt – ページ 4 – arXiv最新論文の紹介

Prompting PaLM for Translation

Prompting PaLM for Translation: Assessing Strategies and Performance [16.7]
経路言語モデル (PaLM) は, 同様に訓練されたLLMの中で最強の機械翻訳(MT)性能を示した。我々は、PaLMのMT機能に関する以前の評価を、より最近のテストセット、現代のMTメトリクス、そして人間の評価で再検討し、その性能は、印象的ではあるが、最先端の監視システムよりも遅れていることを発見した。
論文参考訳（メタデータ） (Wed, 16 Nov 2022 18:42:37 GMT)
- 機械翻訳へのPaLM適用の取り組み
- 様々な手法を比較しているが、現状では教師有りな仕組みには及ばないとのこと。（及ばないとはいえ善戦とはいえるような気はしないでもない）

QAmeleon: Multilingual QA with Only 5 Examples

QAmeleon: Multilingual QA with Only 5 Examples [71.8]
数ショットの学習環境下で事前学習した言語モデルを利用する方法を示す。我々のアプローチであるQAmeleonは、PLMを使用して、QAモデルをトレーニングした多言語データを自動的に生成する。言語毎に5つの例しか持たないデータ合成のためにPLMをプロンプトチューニングすることで、翻訳ベースのベースラインよりも精度が向上する。
論文参考訳（メタデータ） (Tue, 15 Nov 2022 16:14:39 GMT)
多言語QAモデル実現のための合成データ作成においてPLM＋promptを使う手法の提案

Automatic Chain of Thought

Automatic Chain of Thought Prompting in Large Language Models [20.5]
大規模言語モデル(LLM)は中間的推論ステップを生成することで複雑な推論を行うことができる。「ステップ・バイ・ステップ」は、デモのための推論チェーンを1つずつ生成します。自動CoTプロンプト法を提案する。
論文参考訳（メタデータ） (Fri, 7 Oct 2022 12:28:21 GMT)
- Chain of Thoughtの自動化、マニュアルの対応に比べても優れた性能を達成。
- リポジトリはamazon-research/auto-cot: Official implementation for “Automatic Chain of Thought Prompting in Large Language Models” (stay tuned & more will be updated) (github.com)

AMA: Ask Me Anything

Ask Me Anything: A simple strategy for prompting language models [24.3]
大規模言語モデル(LLM)は、単にタスクの実行方法を示す自然言語プロンプトを与えられただけで、追加のトレーニングは行われない。本研究では,質問応答(QA)のプロンプトが,モデル出力を制限するプロンプトよりも優れていることを示す。収集したプロンプトを適用して、入力の真のラベルに対していくつかのノイズの多い投票を行う。プロンプトは、非常に異なる精度と複雑な依存関係を持つことができる。
論文参考訳（メタデータ） (Thu, 6 Oct 2022 06:39:56 GMT)
- タスクをQA方式に変換、複数の回答を束ねることで性能を向上。open-source のGPT-J-6B でfew-shotのGPT3-175Bを超える性能を出せるとのこと。
- リポジトリはHazyResearch/ama_prompting: Ask Me Anything language model prompting (github.com)

Can Large Language Models Truly Understand Prompts?

Can Large Language Models Truly Understand Prompts? A Case Study with Negated Prompts [19.4]
これまでの研究では、言語モデル(LM)のサイズと、異なる下流のNLPタスクにおけるゼロショットのパフォーマンスとの間には、スケーリングの法則が存在することが示されている。本研究では,この現象が負のプロンプトでタスク上で大きなLMを評価する際には有効ではなく,逆のスケーリング法則を示す。
論文参考訳（メタデータ） (Mon, 26 Sep 2022 14:05:10 GMT)
- プロンプトの表現を否定形で逆にした場合の動作はどうなるか検証した論文。結果、モデルサイズによらず大規模言語モデルは否定的なプロンプトを解釈できていないように見えるとのこと。
  - この手のモデルを「指示を出せるAI」と表現はできなさそうな結果でプロンプトは「解こうとしているモノ」を雰囲気で指定しているにすぎなさそう（人間でもひっかけ問題で同様の間違いをすることはあるので発展途上なだけかもだが）
- リポジトリはjoeljang/negated-prompts-for-llms: Can Large Language Models Truly Understand Prompts? A Case Study with Negated Prompts (github.com)

SAP: Sequential Autoregressive Prompting

Bidirectional Language Models Are Also Few-shot Learners [54.4]
SAP(Sequential Autoregressive Prompting)は,双方向モデルの高速化を実現する技術である。 SAPは質問応答と要約に有効であることを示す。この結果から,より広範な言語モデルの創発的特性として,プロンプトに基づく学習が証明された。
論文参考訳（メタデータ） (Thu, 29 Sep 2022 01:35:57 GMT)
- Promptを用いるモデルのほとんどが単方向モデルだが、双方向モデルでもpromptを実現するフレームワークを提案、少ないパラメータでzero/few shotでの優れた性能を確認とのこと。
- 面白い結果である一方で（論文でも触れられている通り）計算コストが凄そう…
  - 双方向だと穴埋めがベースなのでしょうがないとも思いつつ、パラメータが少ないけど計算量が莫大って本当に少ないパラメータで済んでいるのだろうか…？

Prompting for a conversation: How to control a dialog model?

Prompting for a conversation: How to control a dialog model? [9.3]
ダイアログモデルは大量のテキストでトレーニングされるが、その応答はダイアログエージェントの望ましいスコープとスタイルに制限される必要がある。前者を達成するために使用されるデータセットには後者と互換性のない言語が含まれているため、事前訓練されたダイアログモデルは、より小さなキュレートされたデータセットで微調整される。本稿では,上記のトレードオフを緩和できるかどうかを検討する。
論文参考訳（メタデータ） (Thu, 22 Sep 2022 14:59:55 GMT)
- 会話モデルに対するfine tuningの副作用とその緩和の話題。ケンブリッジ大学とAppleの共著で著者へのリファレンスがかわいい。
- リファレンスはおいておいて、dyamic-promptingという名称でテキストの多様性を生み出す能力を壊さずに特定タスクへの適応をあげている。

Visual Prompting

Visual Prompting via Image Inpainting [105.0]
そこで本研究では,NLPにインスパイアされた新しいタスクの入力出力画像例と新しい入力画像の視覚的プロンプトについて検討する。事前学習したモデルに視覚的プロンプトを適用し、様々なダウンストリームイメージ・ツー・イメージタスクで結果を示す。
論文参考訳（メタデータ） (Thu, 1 Sep 2022 17:59:33 GMT)
- 画像処理のために画像のプロンプトに対応するという研究。
- プロンプト部分もマルチモーダルだとテキストと絵でやり方を教えることができてAGIっぽさが増す気がする。
- プロジェクトサイトはVisual Prompting via Image Inpainting (yossigandelsman.github.io)

PromptIDE: プロンプト作成用のIDE

Interactive and Visual Prompt Engineering for Ad-hoc Task Adaptation with Large Language Models [116.3]
最先端のニューラルネットワークモデルは、教師付きトレーニングを必要とせずに、アドホックな言語タスクを解決するために使用することができる。 PromptIDEを使えば、ユーザはプロンプトのバリエーションを試すことができ、プロンプトのパフォーマンスを視覚化し、反復的にプロンプトを最適化できる。
論文参考訳（メタデータ） (Tue, 16 Aug 2022 17:17:53 GMT)
- ついに出た（？）自然言語処理で主流になりつつあるprompt用のIDE。著者にHugging Faceに所属している方がいるのも時代を感じる。
- プロジェクトサイトはInteractive PromptIDE (vizhub.ai)

生成型マルチモーダルモデルへのPrompt Tuning

Prompt Tuning for Generative Multimodal Pretrained Models [75.4]
我々は、理解タスクと生成タスクの両方に適応した統合シーケンス・ツー・シーケンス事前学習モデルに、即時チューニングを実装した。実験結果から,軽量なプロンプトチューニングはファインタニングで同等の性能を発揮することが示された。微調整モデルと比較して、プロンプト調整モデルでは敵攻撃に対する堅牢性が改善されている。
論文参考訳（メタデータ） (Thu, 4 Aug 2022 08:56:38 GMT)
- 生成的マルチモーダル事前学習モデルへのPrompt tuningとFine tuningを比較した論文。prompt-tuned modelの方が頑健性が高いというのは面白い結果（特定データにひっぱらられにくいという意味で納得感もある）
- リポジトリはGitHub – OFA-Sys/OFA: Official repository of OFA (ICML 2022). Paper: OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework

2025年10月
月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31