2026年3月16日 – arXiv最新論文の紹介

AI Knows What’s Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions

AI Knows What’s Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions [51.6]
大規模言語モデルは、その出力がチェックできる場合に信頼性を持って機能しますが医師が不完全なデータに基づいて治療を選択する場合や、投資家が不確実性の下で資本を投入する場合には、パフォーマンスが異なります。ヘリコイド力学(Helicoid dynamics)は、その2番目のドメインの特定の障害状態に与えられる名前である。システムは巧みに働き、エラーに陥り、何がうまくいかなかったかを正確に名付け、さらに高度な技術で同じパターンを再現する。この先進的な事例シリーズは、7つの主要なシステムにまたがる体制を文書化する。
論文参考訳（メタデータ） (Thu, 12 Mar 2026 05:25:49 GMT)
「LLMs reached a point where they could recognize their own cognitive degradation — and yet remained incapable of reliably changing the behavior that fueled their failure. Each session followed the same sequence: competent engagement, a failure mode, accurate meta-recognition of that failure, a proposed correction, and then recurrence of the same failure at higher abstraction, often through polished reflection or procedural deferral. The models recognized they were looping. They continued looping nonetheless.」とたまによく見る現象の分析。

WeEdit: A Dataset, Benchmark and Glyph-Guided Framework for Text-centric Image Editing [103.7]
WeEditは、スケーラブルなデータ構築パイプラインと2つのベンチマーク、2段階のトレーニング戦略を含む、システマティックなソリューションである。具体的には、多様な編集操作と15言語をカバーする330Kのトレーニングペアを生成するHTMLベースの新しい自動編集パイプラインを提案する。アルゴリズム面では、グリフ誘導による微調整を用いて、空間的および内容的事前の明示を注入し、次いで、命令の順守、テキストの明瞭さ、背景の保存と、生成を整合させる多目的強化学習ステージを用いる。
論文参考訳（メタデータ） (Thu, 12 Mar 2026 06:25:09 GMT)
テキストによる画像編集
プロジェクトサイトはWeEdit: A Dataset, Benchmark and Glyph-Guided Framework for Text-centric Image Editing

GLM-OCR Technical Report [65.4]
GLM-OCRは実世界の文書理解のために設計された効率的なコンパクトモデルである。 CogViTビジュアルエンコーダとGLM言語デコーダを組み合わせることで、計算効率と認識性能のバランスが強い。公開ベンチマークと産業シナリオの大規模な評価は、GLM-OCRが競争力や最先端のパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (Wed, 11 Mar 2026 15:55:47 GMT)
比較的軽量ながら強力なGLM-OCRのテクニカルペーパー
リポジトリはGitHub – zai-org/GLM-OCR: GLM-OCR: Accurate × Fast × Comprehensive · GitHub