青島バーチャルスマートエージェント産業大会は、国内で初めて全モードのリアルタイムインタラクションをサポートするビジュアル言語大規模モデル「VisualGPT」を正式に発表し、同時にスマートエージェントトレーニングプラットフォームもリリースしました。全国の開発者向けにマルチモーダルデータと計算リソースを開放し、AIインタラクションが「テキスト対話」から「視覚的インターフェースでの即時インタラクション」の新しい段階に入ったことを示しています。

モデルの特徴  

- 全モードリアルタイムインタラクション:ユーザーが画像/動画をアップロードした後、画面内で直接囲む・マークするまたは音声で質問することができます。モデルは秒単位で構造化された答えや実行可能なコード、または3Dシーンを返します。テキスト入力を切り替える必要はありません。

- その場で即座に結果を得る:VisualGPTは視覚エンコーダーとストリーミングデコーダーを結合し、300ミリ秒以下のエンドツーエンド遅延を実現し、1080p60fpsのリアルタイム映像分析および複数ラウンドの会話をサポートします。

- 多領域応用:公式には教育、医療、金融の3つのシナリオでSDKが公開されています。教師は教材に式を囲んでアニメーション説明を即時に生成できます。医師は画像を確認しながら病変指標を尋ねることができます。金融アナリストはK線グラフに対して直接質問して戦略のバックテストを取得できます。

プラットフォームのサポート  

青島スマートエージェントトレーニングプラットフォームは、A100/H100混合の1000台の計算リソースと10PBのマルチモーダルデータを提供し、企業、大学、個人開発者に無料で申請を開放しています。2026年までに5000台のH100に拡張し、北中国最大のAIトレーニングクラスタを構築する予定です。また、大会では「百企業百景(ひゃくきぎょうひゃくけい)」接続リストを発表し、最初の集計で200以上のビジュアルインタラクションの要望を収集し、2025年末までに100のモデルケースを実装する予定です。

産業上の意味  

VisualGPTの登場により、青島はバーチャルスマートエージェント分野で先手を取ることになりました。市工業情報局によると、今後3年間でこのモデルを基盤として「青島AIイノベーションパーク」を建設し、上流・下流企業を300社以上引き付け、千億円規模のマルチモーダルインタラクション産業チェーンを形成する予定です。