2024年1月12日 – arXiv最新論文の紹介

UniHuman: A Unified Model for Editing Human Images in the Wild [52.4]
実環境における画像編集の複数の側面に対処する統一モデルUniHumanを提案する。モデルの生成品質と一般化能力を向上させるために,人間の視覚エンコーダからのガイダンスを利用する。ユーザスタディでは、UniHumanは平均して77%のケースでユーザに好まれる。
論文参考訳（メタデータ） (Fri, 22 Dec 2023 05:00:30 GMT)
人間の画像を編集するためのモデルの提案、Adobeがかかわっており、「 we curated 400K high-quality image-text pairs for training and collected 2K human image pairs for out-of-domain testing.」はさすが。

A Comprehensive Survey of Hallucination Mitigation Techniques in Large Language Models [7.7]
大きな言語モデル(LLM)は、人間のようなテキストを書く能力の進歩を続けている。重要な課題は、事実に見えるが根拠のないコンテンツを生み出すことを幻覚させる傾向にある。本稿では,LLMにおける幻覚を緩和するために開発された32以上の技術について調査する。
論文参考訳（メタデータ） (Tue, 2 Jan 2024 17:56:30 GMT)
ハルシネーション対策手法のサーベイ
色々出てはいるが実装時に使えるもの使えないものがあり、効果も様々。言語影響が大きいものもあってなかなか決定版はない印象。