智譜が0.9Bの軽量なGLM-OCRを発表：性能で頂点に、千回処理でわずか0.1元

智譜は本日、プロフェッショナルなOCRモデル「GLM-OCR」を正式にリリースし、オープンソース化しました。このモデルは0.9Bの軽量なサイズで、階層を超えたパフォーマンスの飛躍を実現し、多くの権威あるベンチマークテストで首位を記録しています。複雑なドキュメント解析における実際のビジネス上の課題を解決することを目的としています。

コア性能：小規模なサイズでのSOTA表現

パラメータ数がわずか0.9Bであるにもかかわらず、GLM-OCRのパフォーマンスは驚くほどです。権威あるドキュメント解析ランキング「OmniDocBench V1.5」において、94.6点という高得点で優勝し、汎用的大規模モデル「Gemini-3-Pro」に近づいています。テキスト認識、数学式の導出、複雑な表の解析、そしてキーデータ抽出（KIE）の面で、SOTA（業界最高水準）の成果を収めています。

シナリオの突破：複雑なドキュメントの課題に直面

GLM-OCRは、6つの難しい業務シナリオに対して特別な最適化を行い、安定したパフォーマンスを発揮しています:

複雑な表: 合併セルと多段表頭をサポートし、標準的なHTMLコードを直接出力できます。
構造化抽出: カードや領収書などの識別をスマートに行い、標準的なJSON形式で出力します。
手書きとコード: 教育・研究分野での手書き式やプログラマのコードスクリーンショットに対応しています。
特殊なマーク: 印章の認識や多言語混在処理の能力が非常に高いです。

極限効率：推論が速く、コストが低い

効率とコスト管理において、GLM-OCRは非常に強い商業的競争力を示しています:

高速な推論: PDF処理のスループットは1.86ページ/秒に達し、同種のモデルより顕著に優れています。vLLMやOllamaなどの主流なデプロイ方法をサポートしています。
極めてコスト効果の高い： API価格は0.2元/百万トークンまで低下しています。従来のOCRソリューションと比較すると、コストはその10分の1であり、A4スキャン画像1,000枚の処理には約0.5元しかかかりません。

技術の秘密：マルチモーダル構造と強化学習

GLM-OCRはGLM-Vシリーズのアーキテクチャを継承しており、自社開発の「CogViTビジュアルエンコーダー」を統合しています。**複数トークン予測損失（MTP）**と全タスク強化学習の導入により、複雑なレイアウト下での汎化能力が顕著に向上しました。独自の4倍ダウンサンプリング戦略とSwiGLUメカニズムにより、視覚情報と言語デコーダーの効率的な統合が確保されています。

現在、GLM-OCRはGitHubおよびHugging Faceで同時にオープンソース化されており、智譜オープンプラットフォームでも関連APIおよび割引パッケージが公開されています。

百度がオープンソースした3BパラメータのUnlimited OCR: 5日でStarが1万を突破し、長文ドキュメント解析の記録を更新

百度がオープンソースした3BパラメータのエンドツーエンドOCRモデルであるUnlimited OCRは、書籍や論文などの長文ドキュメントに特化しています。プロジェクトリリースから5日でGitHubのStar数が1万を突破し、4つのトレンドチャートでトップになりました。技術面では、推論時に約570Mのパラメータがアクティブ化され、Reference Sliding Window Attention機構を革新的に導入し、ページごとの結合の制限を打ち破り、数十ページを一度に連続して解析することが可能となり、長文ドキュメントの処理効率を大幅に向上させました。

智譜GLM-5.5の準備が整い、8月に世界トップクラスのモデルを追う見込み

智譜は8月に新基盤モデルGLM-5.5を発表予定。パラメータ数は1兆超、アーキテクチャの大飛躍を達成。米国がAnthropicのFable5とMythos5へのアクセスを制限する中、両モデルは長く世界首位。国際情勢の変化を好機に、智譜がブレイクスルーを加速し、市場空白を埋める可能性。....

資金市場の注目株：智譜の時価総額が1兆円を突破国産大モデルが高光時をむかえる

6月22日、香港市場でAI関連株が上昇。智譜AIの株価は一時40%超急騰し2980香港ドルに達し、香港株初の2000香港ドル台を維持する銘柄に。時価総額は1兆香港ドルを突破し、上場来の上昇率は2000%超。大規模言語モデル競争の過熱と米国の規制動向が背景。....

A株市場が大モデル価格時代に入る！智譜（Zhipu）は150億元を調達して科创板に参入する準備をする

中国のAI大手である智譜はA株市場への回帰を加速させ、6月1日に公告を行い、科创板上場申請を建議し、調達額は150億元以内とし、「A＋H」両方の上場プラットフォームを構築する予定です。新規A株を909.88万株から3,876.90万株発行し、長期的な発展のための資金基盤を強化します。

智譜が0.9Bの軽量なGLM-OCRを発表：性能で頂点に、千回処理でわずか0.1元

コア性能：小規模なサイズでのSOTA表現

シナリオの突破：複雑なドキュメントの課題に直面

極限効率：推論が速く、コストが低い

技術の秘密：マルチモーダル構造と強化学習

関連推奨

百度がオープンソースした3BパラメータのUnlimited OCR: 5日でStarが1万を突破し、長文ドキュメント解析の記録を更新

智譜GLM-5.5の準備が整い、8月に世界トップクラスのモデルを追う見込み

資金市場の注目株：智譜の時価総額が1兆円を突破国産大モデルが高光時をむかえる

ZhiPu GLM-5.2 完全オープンソース　先端の知能をすべての人に

A株市場が大モデル価格時代に入る！智譜（Zhipu）は150億元を調達して科创板に参入する準備をする

智譜が0.9Bの軽量なGLM-OCRを発表：性能で頂点に、千回処理でわずか0.1元

コア性能：小規模なサイズでのSOTA表現

シナリオの突破：複雑なドキュメントの課題に直面

極限効率：推論が速く、コストが低い

技術の秘密：マルチモーダル構造と強化学習

関連推奨

百度がオープンソースした3BパラメータのUnlimited OCR: 5日でStarが1万を突破し、長文ドキュメント解析の記録を更新

智譜GLM-5.5の準備が整い、8月に世界トップクラスのモデルを追う見込み

資金市場の注目株：智譜の時価総額が1兆円を突破 国産大モデルが高光時をむかえる

ZhiPu GLM-5.2 完全オープンソース 先端の知能をすべての人に

A株市場が大モデル価格時代に入る！智譜（Zhipu）は150億元を調達して科创板に参入する準備をする

資金市場の注目株：智譜の時価総額が1兆円を突破国産大モデルが高光時をむかえる

ZhiPu GLM-5.2 完全オープンソース　先端の知能をすべての人に