NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search

  • NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search [108.4]
    NExT-Searchは、きめ細かいプロセスレベルのフィードバックを生成AI検索に再導入するために設計された次世代パラダイムである。 NExT-Searchは2つの補完モードを統合している。
    論文  参考訳(メタデータ)   (Tue, 20 May 2025 17:59:13 GMT)
  • 生成AI時代の検索(it disrupts the feedback-driven improvement loop that has historically powered the evolution of traditional Web search.)について、フィードバックの在り方の提案。

Large Language Models for Computer-Aided Design: A Survey

  • Large Language Models for Computer-Aided Design: A Survey [33.4]
    大規模言語モデル(LLM)は近年急速に進歩している。 現代のデザインの複雑さが増すにつれ、LLMがコンピュータ支援設計(CAD)を効率化し、効率化する可能性が高まっている。 本稿では,LLMとCADの交点を探索する最初の体系的な調査について述べる。
    論文  参考訳(メタデータ)   (Tue, 13 May 2025 00:19:04 GMT)
  • LLM & CADのサーベイ。

How Reliable is Multilingual LLM-as-a-Judge?

How Reliable is Multilingual LLM-as-a-Judge? [11.6]
25言語を含む5つの多種多様なタスクにおいて、異なるモデルファミリーから5つのモデルを評価する。 一貫性は言語によって大きく異なり、低リソース言語では特にパフォーマンスが劣っていることが分かりました。 実世界のアプリケーションにおける多言語判断の整合性を改善するアンサンブル戦略を提案する。
論文  参考訳(メタデータ)   (Sun, 18 May 2025 02:32:35 GMT)

マルチリンガル設定でのLLM as a judgeの性能評価。GPT-4oも苦労している印象の結果。「we find that powerful open-source models, such as Qwen- 2.5, achieve comparable performance to OpenAI models in multilingual judgment tasks.」や「Aya fails to demonstrate noticeable improvements. This suggests that fine- tuning with multilingual data may not directly enhance a model’s ability to perform accurate multi- lingual judgments.」など興味深い記載も多い。