- RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models [124.7]
大規模言語モデル(LLM)におけるロールプレイング能力をベンチマークし、評価し、拡張するフレームワークであるRoleLLMを紹介する。 Context-InstructとRoleGPTによって、168,093サンプルでロールプレイする最初の体系的できめ細かい文字レベルのベンチマークデータセットであるRoleBenchを作成します。
論文 参考訳(メタデータ) (Sun, 1 Oct 2023 17:52:59 GMT) - LLMによるrole-playingを実現するフレームワークと評価ベンチマークの提案。
- リポジトリはGitHub – InteractiveNLP-Team/RoleLLM-public: RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models
日: 2023年10月19日
Towards Better Chain-of-Thought Prompting Strategies: A Survey
- Towards Better Chain-of-Thought Prompting Strategies: A Survey [60.8]
CoT(Chain-of-Thought)は,大規模言語モデル(LLM)の促進戦略として使用すると,その印象的な強度を示す。 近年,CoTの促進効果が注目されている。 この調査は、関連する研究全般の参考になるかもしれない。
論文 参考訳(メタデータ) (Sun, 8 Oct 2023 01:16:55 GMT) - Chain of Thoughtのサーベイ、新たな分野でありサーベイできるほどの研究があるというのも若干驚き。Extension Strategiesが非常に参考になった。