FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation [130.4] FActScoreは、世代を一連の原子事実に分解し、信頼できる知識ソースによって支持される原子事実の割合を計算する新しい評価手法である。 我々は、最先端の商用LMが生み出した人々のFActScoreを得るために、広範囲にわたる人的評価を行う。 また、検索と強力な言語モデルを用いてFActScoreを2%未満のエラー率で推定する自動モデルも導入する。 論文参考訳(メタデータ) (Tue, 23 May 2023 17:06:00 GMT)