- PIPPA: A Partially Synthetic Conversational Dataset [13.4]
PIPPA(Personal Interaction Pairs between People and AI)という部分合成データセットを導入する。 PIPPAは、ロールプレイ愛好家のグループを含むコミュニティ主導のクラウドソーシング活動の結果である。 データセットは、26,000の会話セッションに分散された100万以上の発話で構成されている。
論文 参考訳(メタデータ) (Fri, 11 Aug 2023 00:33:26 GMT) - 26,000 conversation sessions、100万発話という大規模な人間-対話エージェント間のデータセット。
- データとモデルはHuggingfaceで公開されている PygmalionAI (Pygmalion) (huggingface.co)、データのライセンスはAGPLとのこと。