當大語言模型還在二維對話框裏“打字”時,魔琺科技直接把它的骨骼、肌肉、聲帶一次生成。5月30日,這家公司發佈全球首個面向開發者的3D數字人開放平臺“魔琺星雲”,讓AI從“說話”進化到“做表情、打手勢、帶身體”。
平臺核心是一套3D多模態實時生成引擎:輸入任意文本,毫秒級輸出同步語音、微表情、肢體動作,並針對手機、平板、車載、電視等終端做了適配,刷新率保持在30fps以上,延遲低於100毫秒。開發者無需預錄動畫,也不用綁定高價GPU,一塊百元級別的入門級芯片即可本地驅動,雲端只負責模型推理與更新。

魔琺科技CTO李豫介紹,祕訣在於“雲-端拆分架構”——把重算力的幾何建模與輕量級的渲染指令分離,終端只接收壓縮後的動作碼流,“就像在線看視頻,但流量只有普通視頻的1/10。”
落地場景已超出“ demo ”範疇:上海中心的一家智慧酒店把星雲SDK接入前臺平板,數字前臺可實時解答入住、開發票、周邊餐飲問題;某省級政務大廳的導辦終端則通過該平臺生成手語版數字人,爲聽障人士提供無障礙服務;在招聘市場,星雲與一家頭部HR SaaS合作,上線AI面試官,候選人完成語音回答後,數字面試官會基於語義即時點頭、記錄、追問,還原真實互動節奏。
平臺採用分層計費:基礎模型免費調用,高級情緒控制、行業知識包按量付費,企業私有化部署可一次性買斷。上線當天,已有超過2000名開發者申請內測,覆蓋教育、醫療、零售、IoT四個賽道。
魔琺科技CEO柴金祥表示,下一步將開源部分動作驅動接口,並聯合芯片廠商推出“星雲Ready”認證,“目標是一年內在10億臺中低端設備上跑起來,讓具身智能成爲默認交互方式,而不是高端展廳裏的花瓶。”
