大規模言語モデルが2次元のチャットボックス内で「タイプ」している間、魔珐科技はその骨格、筋肉、声帯を一度に生成しました。5月30日、同社は世界初の開発者向け3Dデジタル人間オープンプラットフォーム「魔珐星雲(マーファ・スタークラウド)」を発表し、AIが「話す」ことから、「表情をつける、ジェスチャーをする、体を動かす」へと進化させました。

プラットフォームのコアは、3Dマルチモーダルリアルタイム生成エンジンです。任意のテキストを入力すると、ミリ秒単位で同期音声、微表情、身体動作が出力され、スマートフォン、タブレット、車載、テレビなどの端末に対応しています。リフレッシュレートは30fps以上で、遅延は100ms未満です。開発者は事前にアニメーションを録画する必要がなく、高価なGPUにバインドする必要もありません。百元程度のエントリーレベルのチップでローカルで駆動でき、クラウドはモデルの推論と更新のみを行います。

image.png

魔珐科技のCTOである李豫(リー・ユー)氏によると、秘密は「クラウド-エンド分割アーキテクチャ」です。計算量の多い幾何学モデリングと軽量なレンダリング命令を分離し、エンドユーザーは圧縮されたアクションストリームを受け取ります。「まるでオンラインで動画を見るようなものですが、通信量は通常の動画の1/10です。」

実際の導入シーンは「デモ」を越えています。上海センターにあるスマートホテルでは、星雲SDKをフロントパッドに接続し、デジタルフロントがリアルタイムでチェックイン、領収書の発行、周辺飲食についての質問に答えています。ある都道府県レベルの行政サービスホールでは、導办端末を通じてこのプラットフォームを使って手話のデジタル人間を生成し、聴覚障害者にアクセシブルなサービスを提供しています。就職市場では、星雲は上位のHR SaaS企業と提携し、AI面接官を導入しました。応募者が音声で回答すると、デジタル面接官は文脈に基づいて即座にうなずき、記録し、追加質問を行い、現実的な対話のペースを再現します。

プラットフォームは階層式課金方式を採用しています。基本モデルは無料で利用でき、高度な感情制御や業界知識パッケージは使用量に応じて課金され、企業のプライベート配置は一括購入可能です。リリース当日には、2000人以上の開発者が内側テストを申請し、教育、医療、小売、IoTの4つの分野をカバーしています。