ComPO: Community Preferences for Language Model Personalization
ComPO: Community Preferences for Language Model Personalization [122.5] ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。 ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。 論文参考訳(メタデータ) (Mon, 21 Oct 2024 14:02:40 GMT)
言語モデルをpersonalizationする手法COMPOの提案。「Our proposed community preference optimization incorporates subreddit-specific contexts into the model, tailoring outputs to align with the distinct norms and values of individual communities.」というアプローチ。