LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods

LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods [21.6]
「LLMs-as-judges」は自然言語応答に基づく評価器である。本稿では,5つの重要な視点から’LLMs-as-judges’パラダイムを包括的に調査する。我々は,研究と実践の両方において,’LLMs-as-judges’の開発と適用に関する洞察を提供することを目的としている。
論文参考訳（メタデータ） (Sat, 07 Dec 2024 08:07:24 GMT)
最近多い、LLMs-as-Judgesのサーベイ。複数束ねるアプローチが多くなってきている印象もある
リポジトリGitHub – CSHaitao/Awesome-LLMs-as-Judges: The official repo for paper, LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods.も参考になる

コメントを残す

コメントを残す コメントをキャンセル