テキスト生成 – arXiv最新論文の紹介

Controllable Text Generation for Large Language Models: A Survey

Controllable Text Generation for Large Language Models: A Survey [27.1]
本稿では,大規模言語モデルにおける制御可能なテキスト生成の最近の進歩を体系的にレビューする。我々はCTGタスクをコンテンツ制御と制御の2つの主要なタイプに分類する。現在の研究における重要な課題には、流用率の低減や実用性といった課題に対処する。
論文参考訳（メタデータ） (Thu, 22 Aug 2024 17:59:04 GMT)
Controllable Text Generationのサーベイ、LLM全般としても良い資料で広範な内容。サーベイの構造はCTGSurvey/figures/framework.png at main · IAAR-Shanghai/CTGSurvey · GitHub
リポジトリはGitHub – IAAR-Shanghai/CTGSurvey

EIPE-text: Evaluation-guided Iterative Plan Extraction for long-form narrative text generation

EIPE-text: Evaluation-Guided Iterative Plan Extraction for Long-Form Narrative Text Generation [114.5]
長文物語テキスト生成のための評価誘導反復計画抽出法(EIPE-text)を提案する。 EIPEテキストには、計画抽出、学習、推論の3段階がある。小説やストーリーテリングの分野におけるEIPEテキストの有効性を評価する。
論文参考訳（メタデータ） (Thu, 12 Oct 2023 10:21:37 GMT)
長文生成のためのフレームワーク、plan extraction, learning, inferenceからなり、計画時にQAベースの評価を行うのが特徴的。学習ステップでは in-context learningの適用も想定されており、一般的な学習とは若干異なる動きでも効果があるよう。

Clinical Note Generation from Doctor-Patient Conversations using Large Language Models

WangLab at MEDIQA-Chat 2023: Clinical Note Generation from Doctor-Patient Conversations using Large Language Models [2.4]
我々はMEDIQA-Chat 2023の共有タスクを医師と患者との会話から自動的な臨床ノート作成のために提出した。本稿では,共有タスクデータに事前学習言語モデル(PLM)を1つ,大言語モデル(LLM)を2つ導入し,その2つについて報告する。専門家の人間の精査は、ICLベースのGPT-4によるアプローチによって生成されたメモが、人間によるメモと同じくらい頻繁に好まれていることを示している。
論文参考訳（メタデータ） (Sat, 3 Jun 2023 17:56:29 GMT)
患者との対話記録からの臨床ノート作成、コンペティションで行われたもののよう。GPT-4 + ICLがPLM + finetuneに勝っている点、GPT-4 + ICLが人が書いたGrund Truthと互角レベルで人に好まれる点など面白い結果となっている。
リポジトリはGitHub – bowang-lab/MEDIQA-Chat-2023: A repository for organizing our submission to the MEDIQA-Chat Tasks @ ACL-ClinicalNLP 2023

MGTBench: Machine-Generated Textの検出ベンチマーク

MGTBench: Benchmarking Machine-Generated Text Detection [27.7]
大規模言語モデル(LLM)は、人間によって書かれたテキストと区別が難しいような、人間のような言語を生成することができる。 MGTに対する既存の検出方法は、異なるモデルアーキテクチャ、データセット、実験的な設定で評価される。我々はMGTBenchというMGT検出のための最初のベンチマークフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 26 Mar 2023 21:12:36 GMT)
機械で生成されたテキストを検出可能かのベンチマーク。GitHub – Hello-SimpleAI/chatgpt-comparison-detection: Human ChatGPT Comparison Corpus (HC3), Detectors, and more! 🔥が好成績とのこと。一方で「We ﬁnd that, with only small perturbations on the MGTs, ChatGPT Detector can be easily bypassed」という記載は気になる。
リポジトリはGitHub – xinleihe/MGTBench

MarioGPT

MarioGPT: Open-Ended Text2Level Generation through Large Language Models [9.9]
タイルベースのゲームレベルを生成するために訓練された細調整GPT2モデルであるMarioGPTを紹介する。我々は,MarioGPTが多様なレベルを生成できるだけでなく,制御可能なレベル生成のためにテキストをプロンプできることを示す。
論文参考訳（メタデータ） (Sun, 12 Feb 2023 19:12:24 GMT)
Text2Level Generationという名称のテキストからのゲーム面の生成。これを生成してみようと思うのが面白い。
（割とどうでもよいが）内部的にはテキストを合成しているのでテキスト生成にカテゴライズするのが良いのか、プログラムのソースコード相当と考えてコード自動生成とするか悩ましい。

Toward General Design Principles for Generative AI Applications

Toward General Design Principles for Generative AI Applications [16.1]
生成AIアプリケーションの設計に関する7つの原則を提示する。生成AIの特徴として、複数の成果と不完全性、探索と制御、メンタルモデルと説明の6つの原則が重視されている。我々は、生成モデルの有害な出力、誤用、または人的変位の可能性によって引き起こされる可能性のある潜在的な害に対して設計をするようデザイナーに促す。
論文参考訳（メタデータ） (Fri, 13 Jan 2023 14:37:56 GMT)
近年、強力な生成系AI（画像生成、テキスト生成、…）のリリースが相次いでいるがその設計で守るべき原則を整理した論文、100以上の引用数があり納得感のある指摘となっている
７つの原則は「Design against harms」だけが独立（全体をカバー）、その他は「Multiple outputs」「Imperfection」「Mental models」「Explanation」「Exploration」「Control」が挙げられている。

Open-world Story Generation with Structured Knowledge Enhancement: A Comprehensive Survey

Open-world Story Generation with Structured Knowledge Enhancement: A Comprehensive Survey [25.9]
本稿では,既存の手法が構造的知識をストーリー生成にどのように統合するかについて,体系的な分類法を提案する。知識に富んだストーリー生成の課題について多次元的な洞察を与える。
論文参考訳（メタデータ） (Fri, 9 Dec 2022 02:19:07 GMT)
ストーリー生成に関するサーベイ。長文かつ一貫性が必要など非常に難しいタスク。外部データの活用を軸としたサーベイ。

MoCa: Momentum Calibration

Momentum Calibration for Text Generation [86.6]
テキスト生成のためのMoCa(Momentum Calibration)を提案する。 MoCaは、ビームサーチを備えた運動量移動平均発生器を用いて、ゆっくりと進化する(しかし一貫した)サンプルを動的に生成するオンライン手法である。
論文参考訳（メタデータ） (Thu, 8 Dec 2022 13:12:10 GMT)
テキスト生成時のビームサーチ部分を強化学習的な手法で改善するという研究。
CNN/DMでの結果が非常に高い

GENREAD: 検索の代わりの大規模言語モデル

Generate rather than Retrieve: Large Language Models are Strong Context Generators [74.9]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。我々は,提案手法をgenRead と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文参考訳（メタデータ） (Wed, 21 Sep 2022 01:30:59 GMT)
- open-domain QAで良く用いられる検索モジュールを大規模言語モデルによる生成器に置き換えることで優れた性能を達成との報告。 TriviaQA と WebQ でSoTAを主張。
- 大規模言語モデルからうまく情報を引き出す事と大規模な知識データベースを検索する事が近しく、しかも前者の性能が良いことを示しているような気がしていて、Transformer等による情報の圧縮はかなり効果的なんだろうなという直感。

vec2text

vec2text with Round-Trip Translations [31.0]
本研究では,任意の自然言語テキストを生成することができるモデルについて検討する。それらは普遍的なvec2textモデルと呼ばれます。普遍性,多様性,流布性,意味的構造という,4つの望ましい特性を提案する。
論文参考訳（メタデータ） (Wed, 14 Sep 2022 17:20:18 GMT)
- 2vecの逆でベクトルからのテキスト生成。面白い研究であるし、今も今後も機械翻訳や要約などテキスト生成系の技術は近しい動きをしているのだろうが、自然言語って何なんだろうと思わなくもない。

2025年8月
月	火	水	木	金	土	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31