- GLM-OCR Technical Report [65.4]
GLM-OCRは実世界の文書理解のために設計された効率的なコンパクトモデルである。 CogViTビジュアルエンコーダとGLM言語デコーダを組み合わせることで、計算効率と認識性能のバランスが強い。 公開ベンチマークと産業シナリオの大規模な評価は、GLM-OCRが競争力や最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (Wed, 11 Mar 2026 15:55:47 GMT) - 比較的軽量ながら強力なGLM-OCRのテクニカルペーパー
- リポジトリはGitHub – zai-org/GLM-OCR: GLM-OCR: Accurate × Fast × Comprehensive · GitHub