中国の人工知能分野におけるリーディングカンパニーであるZhipu AI(智譜AI)が再び業界を騒がせています。AIbaseの最新情報によると、Zhipu AIはこのほど新世代の汎用視覚モデル「GLM-4.1V-Thinking」を正式にオープンソース化しました。この90億パラメータを持つマルチモーダル推論モデルは優れた性能と広範な応用シーンにより、複数の権威ある評価で記録を更新し、720億パラメータのモデルと比較しても優れた実力を示しています。以下にAIbaseがまとめた最新情報をご紹介し、この画期的な技術について詳しくご説明します。
思考過程の推論を導入し、性能が大幅向上
GLM-4.1V-Thinkingは、Zhipu AIが以前に開発したGLM-4Vアーキテクチャをもとに深く最適化され、革新的な思考過程推論メカニズム(Chain-of-Thought Reasoning)を導入しています。このメカニズムにより、複雑な認知タスクでのモデルの性能が顕著に向上し、画像、動画、ドキュメントなどのマルチモーダル入力の処理効率がさらに高まりました。AIbaseによると、このモデルはMMStar、MMMU-Pro、ChartQAPro、OSWorldなどの28の権威ある評価テストにおいて、23項目で100億パラメータのモデルの最高スコアを達成し、そのうち18項目ではパラメータ数が大きいQwen-2.5-VL72Bモデルと同等または上回る結果を示しており、驚異的な推論能力を証明しています。
マルチモーダル機能が全面的に網羅され、さまざまな業界に恩恵をもたらす
GLM-4.1V-Thinkingは最大64Kの文脈長と4Kの画像解像度をサポートし、中国語と英語の両言語に対応し、多言語環境での複雑なタスクにもスムーズに対応できます。長時間の動画理解、画像質問応答、学問的問題解決、文字認識、ドキュメント解釈、画像位置特定(Grounding)、GUIエージェント操作、コード生成など、あらゆるタスクを柔軟に処理できます。そのオープンソース特性により、使用のハードルがさらに低下し、1枚の3090グラフィックカードで動作可能です。無料商用利用許諾により、企業や開発者にとって広範な応用可能性を提供します。AIbaseは、この柔軟性と高性能の組み合わせが、教育、金融、医療などの業界におけるAI技術の実装を大きく促進すると考えています。
オープンソース戦略により、グローバルAI競争をリード
Zhipu AIは今回のGLM-4.1V-Thinkingを完全にオープンソース化し、Hugging Faceプラットフォームを通じてモデルの重みとデモを提供することで、AI技術の普及を目指す姿勢を示しています。AIbaseは、Zhipu AIが近年オープンソース分野で積極的な動きを見せていることに注目しています。GLMシリーズのモデルは累計で世界中で3,000万回以上ダウンロードされ、中国AIエコシステムの重要な一部となっています。今回公開されたGLM-4.1V-Thinkingは、開発者に高性能なマルチモーダル推論ツールを提供するだけでなく、MITライセンスによって商業利用の柔軟性を保証し、Zhipu AIがグローバルAI分野における競争力をさらに強化しています。
世界的なトップモデルとの直接対決
性能比較において、GLM-4.1V-Thinkingは目覚ましい実力を発揮しています。AIbaseが総合的な評価データを分析した結果、このモデルは多くの複雑なタスクで優れた性能を発揮し、特にSTEM分野の問題や長文ドキュメントの理解といった高度なシナリオでは、OpenAIのGPT-4oモデルを超える部分も見られました。このような飛躍的な進歩は、Zhipu AIがマルチモーダル推論分野において世界の先端レベルに到達したことを示しており、OpenAIやGoogleなどの国際的な巨頭と直接競争できるようになったことを意味しています。
中国AIの新たな時代の幕開け
中国AI分野の「新四虎」の一つとして、Zhipu AIは継続的な技術革新とオープンなエコシステム戦略を通じて、グローバルAIの構図を変革しています。AIbaseは、GLM-4.1V-ThinkingのリリースはZhipu AIの技術力の証であり、中国AI産業が世界の舞台で重要な発言権を得たことを示していると考えています。今後、より多くの開発者がGLM-4.1V-Thinkingを基盤にしてイノベーションを生み出し、中国AIの国際的な影響力がさらに拡大することになるでしょう。
結論