在 2026 移動雲大會上,中國移動正式推出了移動模型服務平臺——MoMA。這一平臺的發佈,標誌着大模型應用正加速從“實驗室”走向“千行百業”,力求讓AI像水和電一樣實現“隨處可用”。

一站式集成: 300 餘款主流模型“拎包入住”

MoMA平臺的核心優勢在於其強大的聚合能力。通過統一的API網關,用戶只需一次接入,即可調用包括中國移動自研“九天”基座大模型在內的 300 多款業界主流模型。無論是國產之光DeepSeek、通義千問、Kimi,還是豆包、GLM等優質資源,均已悉數入駐。

這種集成模式覆蓋了文本生成、語音處理及多模態理解等全方位能力,能精準匹配金融、教育、醫療等複雜業務場景。

智能調度:讓模型調用告別“選擇困難”

爲了解決企業在不同模型間切換的痛點,MoMA首創了智能路由引擎。系統能夠自動識別用戶需求,在“成本優先”、“效果優先”與“均衡優先”三種策略間靈活切換。

值得關注的是,該平臺具備極高的業務連續性保障:當某個模型出現故障或限流時,MoMA可實現秒級自動切換。同時,基於國產算力的自研推理引擎配合智能緩存、上下文複用等技術,使單位Token成本壓降了30%以上,資源佔用率降低超過50%

安全底座:首推“機密模型”服務

針對政務、金融等對數據隱私極度敏感的行業,MoMA推出了“機密模型”服務。通過硬件隔離技術將模型部署在機密容器中,實現了計算過程的“可用不可見”,確保從芯片到應用的全鏈路數據安全。

閉環運營:算力消費透明化

在運營層面,MoMA引入了集約化管理模式,實現Token全生命週期的精準監控。平臺支持流式實時計費,用戶使用產生的賬單延遲不超過 1 分鐘,真正做到了“即用即付”。

此外,全鏈路可觀測能力讓開發者能夠實時監測時延、吞吐量及GPU資源佔用等關鍵指標。這種清晰的損耗記錄和風險管控機制,不僅杜絕了資源擠佔,也爲企業的AI投入產出比提供了直觀的決策依據。