智譜は今日、自社の核心AIエージェントモデル「AutoGLM」を正式にオープンソース化したことを発表しました。この「Phone Use(スマホ操作)」能力を持つスマートエージェントは、配達注文や航空券予約など数十ステップにわたる複雑なスマホ操作プロセスを安定して実行できます。オープンソース化により、あらゆるハードウェアメーカー、スマホメーカー、および開発者は、自分のシステムで「画面を理解できる」AIアシスタントを再現することが可能になります。これは、人間のようにタップ、入力、スライドなどの操作を行うことができます。

AutoGLMは、WeChat、淘宝(タオバオ)、抖音(ドウイン)など50以上の頻繁に使用される中国語アプリケーションの主要なシーンをサポートしています。そのデモ効果は、以前業界で注目を集めた「豆包スマホ(ドウバオスマートフォン)」と非常に似ています。ユーザーが手動で操作する必要はなく、AIが画面の内容を見ることで、タスクを自動的に実行し、複数ステップの操作を連続して完了し、結果に直接到達します。他のスマートエージェントの解決策と比較して、AutoGLMの強みは安定性と複雑なプロセス処理能力であり、特に実際のスマホ環境での長い連鎖的なタスクの実行に適しています。
このオープンソースの行動は、AIスマートフォンの技術的障壁を大幅に低下させ、AIが「あなたの代わりにスマートフォンを操作する」ということが、トップメーカーだけの専有技術ではなく、業界全体が構築可能な能力になることを可能にします。これにより、AIスマートフォンエコシステムは閉鎖から開放へと進み、より多くのデバイスがシステムレベルのスマートエージェント体験を持つことになります。AutoGLMはローカルとクラウドの両方の展開をサポートしており、メーカーに最大限のデータとプライバシーの制御権を残すだけでなく、ユーザーがプライバシー情報をアップロードすることなく同等のスマート体験を得る機会が今後あることを意味しています。
次世代のシステムレベルのAIを構築しようとするスマートフォンメーカーにとって、AutoGLMのオープンソースは戦略的な補完となるでしょう。また、開発者にとっても、再現可能で変更可能で拡張可能な完全なスマートエージェントの能力基盤を提供します。より多くのメーカーがエコシステムに加われば、このような本格的なインタラクティブなAIエージェントは、将来的にスマートフォンの標準機能となる可能性があります。
