2024年9月4日 – arXiv最新論文の紹介

Symbolic Working Memory Enhances Language Models for Complex Rule Application [87.3]
大規模言語モデル(LLM)は、顕著な推論性能を示しているが、多段階の推論に苦慮している。本稿では,外部ワーキングメモリを用いたLLMの拡張と,ルール適用のためのニューロシンボリックフレームワークを提案する。当社のフレームワークは,LLMベースのルール実装とシンボリックルールグラウンディングを反復的に実施する。
論文参考訳（メタデータ） (Sat, 24 Aug 2024 19:11:54 GMT)
LLMが苦手とするルールを適用していく多段推論に対応するため作業領域を用いる手法の提案。「We implement this working memory to store rules and facts in both natural language and their symbolic forms (i.e., in Prolog), thus supporting precise symbolic reference.」とPrologのような形式を併用するのが特徴的。
- 人でもこの手の疑似コードを使うことを考えると、他のタスクでも有効かもしれない。
リポジトリはGitHub – SiyuanWangw/RuleApplication

Controllable Text Generation for Large Language Models: A Survey [27.1]
本稿では,大規模言語モデルにおける制御可能なテキスト生成の最近の進歩を体系的にレビューする。我々はCTGタスクをコンテンツ制御と制御の2つの主要なタイプに分類する。現在の研究における重要な課題には、流用率の低減や実用性といった課題に対処する。
論文参考訳（メタデータ） (Thu, 22 Aug 2024 17:59:04 GMT)
Controllable Text Generationのサーベイ、LLM全般としても良い資料で広範な内容。サーベイの構造はCTGSurvey/figures/framework.png at main · IAAR-Shanghai/CTGSurvey · GitHub
リポジトリはGitHub – IAAR-Shanghai/CTGSurvey