具身智能與大模型的融合再進一步。智元機器人近日宣佈與MiniMax(上海稀宇科技)達成戰略合作,MiniMax將爲智元人形機器人提供端到端的文本到語音(TTS),顯著提升機器人在真實場景中的自然交互能力與情感表達水平。
全鏈路語音賦能,打造“會說話”的智能體
此次合作聚焦語音合成核心技術,MiniMax將其在高自然度語音生成、多情感語調建模、低延遲實時推理等方面的領先能力,深度集成至智元機器人系統。這意味着智元人形機器人將能:
- 以接近真人的流暢語調進行對話;
- 根據上下文自動切換喜悅、關切、鄭重等情感語氣;
- 在複雜噪聲環境下實現低延遲、高清晰度語音輸出,保障人機溝通效率。
該技術將率先應用於智元在家庭服務、商業導覽、醫療陪護等場景的機器人產品中,使AI不僅“看得見、做得對”,更能“說得準、講得暖”。
強強聯合:大模型公司×具身智能先鋒
MiniMax作爲國內大模型第一梯隊代表,其MoE架構大模型與端側推理優化能力已廣泛應用於手機、汽車、IoT設備;智元機器人則在人形機器人本體控制、運動規劃與場景落地方面快速突破。此次合作,標誌着“大腦”(大模型) 正加速融合。
行業分析指出,語音交互是人形機器人走向實用化的關鍵一環。當機器人能以自然、有溫度的聲音與人交流,用戶接受度與信任感將大幅提升,爲規模化商用鋪平道路。
AIbase觀察:語音不再是“附屬功能”,而是具身智能的“靈魂接口”
在當前人形機器人競賽中,多數廠商聚焦於行走、抓取等物理能力,而智元與MiniMax的合作,凸顯了對交互體驗的重視。未來,真正能走進家庭與公共場所的機器人,或許不是跑得最快的,而是最會“說話”、最懂人心的。
隨着大模型廠商從“雲端”走向“端側”,與硬件廠商共建“感知—決策—執行—表達”全棧智能體,中國具身智能生態正加速走向成熟。而這場由語音開啓的溫情革命,或將成爲人形機器人破圈的關鍵。
