2023年10月19日 – arXiv最新論文の紹介

RoleLLM、RoleBench

RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models [124.7]
大規模言語モデル(LLM)におけるロールプレイング能力をベンチマークし、評価し、拡張するフレームワークであるRoleLLMを紹介する。 Context-InstructとRoleGPTによって、168,093サンプルでロールプレイする最初の体系的できめ細かい文字レベルのベンチマークデータセットであるRoleBenchを作成します。
論文参考訳（メタデータ） (Sun, 1 Oct 2023 17:52:59 GMT)
LLMによるrole-playingを実現するフレームワークと評価ベンチマークの提案。
リポジトリはGitHub – InteractiveNLP-Team/RoleLLM-public: RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models

Towards Better Chain-of-Thought Prompting Strategies: A Survey [60.8]
CoT(Chain-of-Thought)は,大規模言語モデル(LLM)の促進戦略として使用すると,その印象的な強度を示す。近年,CoTの促進効果が注目されている。この調査は、関連する研究全般の参考になるかもしれない。
論文参考訳（メタデータ） (Sun, 8 Oct 2023 01:16:55 GMT)
Chain of Thoughtのサーベイ、新たな分野でありサーベイできるほどの研究があるというのも若干驚き。Extension Strategiesが非常に参考になった。