ChatGPTとtext-davinci-003 – arXiv最新論文の紹介

ChatGPT: Optimizing Language Models for Dialogue (openai.com)
極めて強力な対話用の言語モデル。Google検索か！？というレベルで回答をしてくれる。（間違っている場合も多いが…）
Reinforcement Learning from Human Feedback (RLHF)を用いており、GPT-3.5をfine tuningしているとのこと。
11/29に出たtext-davinci-003もGPT-3.5シリーズのモデルでInstructGPT(code-davinci-002)ベースのtext-davinci-002を改善したものとのことで、こちらも性能が高い。NLPを変える可能性を感じている。
Model index for researchers – OpenAI API

コメントを残す

コメントを残す コメントをキャンセル