在剛剛結束的百度 AI DAY 上,百度文小言正式宣佈了品牌煥新和功能升級的消息。此次升級不僅包括全新的視覺形象,更重要的是引入了多模型融合調度技術,這將極大增強其語音識別和圖片問答的能力。
文小言的多模型融合調度是本次升級的核心亮點。通過整合百度自研的文心 X1、文心4.5等模型,並引入了諸如 DeepSeek-R1和可靈等第三方優質模型,用戶可以根據需求靈活選擇使用最適合的模型。用戶只需輕鬆點擊 “自動模式”,系統就會智能選擇最佳模型組合,顯著提高響應速度與任務處理能力,真正實現了一鍵解決問題的理想體驗

在語音能力方面,全新升級的語音大模型支持多種方言對話、複雜知識問答,甚至可以隨時打斷對話。這意味着用戶不僅可以通過語音獲取知識回答,還可以進行趣味角色扮演,交互體驗更爲豐富。百度語音首席架構師賈磊指出,這款模型是行業首個基於全新互相關注意力(Cross-Attention)技術的端到端語音語言大模型,相比行業平均水平,其調用成本降低了50%-90%。同時,該模型的推理響應速度極快,等待時間縮短至1秒左右,讓用戶的交互體驗更加流暢。
此外,文小言還推出了創新的圖片問答功能,用戶可以通過拍照或上傳圖片,直接以文字或語音提問,獲取詳細解析。例如,用戶拍攝一道數學題,可以實時獲得解題思路與視頻解析;上傳商品圖片則能幫助比較參數和價格,方便購物決策。新增的 “圖個冷知識” 功能更是富有趣味,用戶可以預設 “歷史學者” 或 “科技達人” 等視角,從多維度解讀同一圖片,提升了互動的樂趣。
百度文小言的這次升級無疑爲用戶帶來了更爲智能和便捷的體驗,未來的互動將會更加多樣化。
