6月5日,在2026AI產業應用大會上,騰訊雲音視頻正式發佈AI原生能力底座WAND。 依託超過20年的技術積累,騰訊雲音視頻此次從底層模型、媒體能力到接入方式進行全面升級,音視頻媒體AI能力將以Agent-Native模式向行業開放,實現了從提供單點媒體處理能力向面向AI應用與Agent的原生媒體底座的戰略升級

image.png

WAND架構由模型引擎、能力層和場景方案三層構成,包含編解碼、增強、擦除、生成、理解、音頻六大自研媒體專用模型,補充了主流生成式大模型在媒體生產流程中的不足。能力層則將60+項媒體AI能力按生成、理解、處理、編碼重新組織,通過API、Agent預編排工作流(Agentic Workflow)和Skills三種模式開放,支持Agent端到端自動跑通整條鏈路,無需切換工具

image.png

WAND能力架構圖

在真實業務中,WAND展現出高適配與高效率優勢。在電商應用中,WAND生成模型可針對不同品類定製處理策略,有效降低報錯率並提升圖片可用率。在短漫劇創作中,WAND將劇本生成、角色一致性保持等環節串聯爲自動鏈路,使平均生產效率提升90%,已服務國內80%以上的頭部漫劇平臺,其AI增強與無痕擦除技術更是雙雙榮獲NAB Show2026年度產品獎

此外,面對高併發、極低延遲要求的賽事直播場景,WAND通過自研模型協同調度,將識別、生成、合成、編碼整合爲全自動化流程,相較傳統方案可節省超50%的碼率,已累計支撐數千場全球頂級賽事

作爲連續11次保持中國及出海市場份額第一的領跑者,騰訊雲音視頻此舉正加速音視頻能力成爲可被Agent統一調度的生產級工具,全面賦能AI Agent時代的視聽應用創新