2026年の春節期間、中国の大規模モデルの競争は連続して注目を集めた。DeepSeekが現象級製品となった後、智譜AIの新世代の大規模モデルGLM-5もその神秘を解き明かした。この動きは直接的に資本市場を沸かせ、智譜の株価は最近大幅に上昇し、強気で200%

マスクの暴露:謎のモデル「Pony Alpha」はGLM-5だった

数日前、世界中のモデルサービスプラットフォームOpenRouterに、「Pony Alpha」という名前の匿名モデルが登場し、コードの記述能力がClaude Opusと匹敵するため、世界中で話題になった。

  • 身分確認:このモデルのシステムプロンプトは自身をGLMであることを明らかにしている。

  • 「指紋」の識別:ネットユーザーはGLMシリーズ固有の論理的なバグ(例えば、「鍋内に植物油を入れて熱くする」と入力すると特定の異常な答えが返るなど)を検証することで、ほぼ確実に所属先を特定できる。

コアブラックテクノロジー:DeepSeekの構造を再利用し、パラメータを倍増

GLM-5は、DeepSeek-V3と同じスパースアテンション構造(DSA)を選択した。これは非常にコストパフォーマンスの高い進化戦略と見なされている。

  • スケールの飛躍:総パラメータ数は高さ745Bであり、前バージョンのGLM-4.7の2倍である。

  • 計算効率:256のエキスパートを持ち、一度に8つ(約44Bのアクティベーションパラメータ)が活性化され、スパース度はわずか5.9%である。

  • 長文およびマルチモーダル:最大の202Kトークンのコンテキストウィンドウをサポートしている。また、2026年の市場ニーズに対応して、GLM-5は動画理解などのマルチモーダル機能を強化し、以前のDeepSeekの純テキスト構造の欠点を補った。

業界への影響:展開のハードルがさらに低下

DSA構造を採用したことで、GLM-5はvLLMやSGLangなどの主要な推論フレームワークの既存の最適化手法を直接再利用できる。これは企業向けユーザーがこのモデルを展開する際、技術的ハードルと計算リソースのコストが大幅に低下することを意味する。

中国のAIが海外大規模モデルを「盗む」波の中で、智譜はGLM-5の強力な性能によって、モデルの性能と工学実装におけるトップクラスの実力を再度証明した。