在2024年8月21日舉辦的火山引擎AI創新巡展上海站上,火山引擎展示了其豆包大模型的全面升級,以及對話式AI實時交互解決方案的增強。
豆包大模型自5月15日發佈以來,日均tokens使用量已超5000億,企業客戶使用量增長22倍。新版豆包大語言模型的綜合能力提升了20.3%,其中角色扮演能力提升38.3%,語言理解能力提升33.3%。

其中,豆包·文生圖模型對長文本有更精準的圖文匹配能力,多主體、多位置、手部結構等複雜場景的生圖能力更強,更善於理解中國特色元素,創造更具美感的中國風圖片。豆包·語音識別模型基於大語言模型豐富的知識和推理能力,通過上下文感知,提升語音識別準確性,在多個公開測試集中,與國內公開發布的語音識別大模型相比,錯誤率最高降低40%;支持一個模型識別普通話和粵語、上海話、四川話、西安話、閩南語等方言。豆包·語音合成模型升級了流式語音合成能力,能夠實時響應、精準斷句,支持“邊想邊說”。
此外,火山引擎發佈對話式 AI 實時交互解決方案,該方案整合了豆包大模型和實時音視頻(RTC)技術,提供端到端的大模型實時對話方案。企業可以輕鬆地在自己 AI 應用中嵌入該實時語音功能,用戶不僅能用語音與 AI 進行交談,還能像平時說話一樣,在對話過程中適時打斷或插話,經過升級後的 AI 聲音具備較好表現力和感情色彩,對話更自然、更真實、更流暢,讓大模型交互體驗更強。
火山引擎還宣佈與多點DMALL聯合成立零售大模型生態聯盟,旨在推動零售行業智能化升級,加速行業創新步伐。首批18家成員單位參與了啓動儀式。此外,汽車大模型生態聯盟也迎來了新成員,火山引擎正與聯盟成員在AI汽車行業定義、評測標準發佈等方面進行協作。
