豆包發佈實時語音大模型中文一流，雙商在線

近日，豆包公司宣佈推出其全新的實時語音大模型，號稱在中文對話方面實現了 “斷崖式領先”，標誌着 AI 對話能力的顯著提升。這一模型在豆包 App（版本號7.2.0新春版）中全量開放，爲用戶帶來了更爲豐富和真實的語音交流體驗。

據介紹，豆包的實時語音大模型實現了語音理解與生成的深度融合，形成了端到端的語音對話系統。這一技術的突破讓模型在語音表現力、控制力以及情緒承接方面的表現非常出色，具備低時延和隨時打斷對話的功能，極大提升了用戶的互動體驗。官方表示，該技術不僅在 “智商” 上有所提升，情商也在線，能夠更好地理解和表達情感。

此次更新還包括了實時語音通話功能，該功能依託於豆包最新的大模型，可以在不同場景中靈活調整對話節奏、兒化音、音量和氣音等細節。此外，新的語音功能還能模仿不同的聲線，支持多種方言與英語對話，甚至具備部分歌曲的演唱能力。這一切都讓人機對話的真實感提升到了一個新的層次，幾乎達到了 “人機難辨” 的境地。

豆包的研發團隊表示，這一全新技術基於端到端的框架，通過原生方法深度融合語音與文本的模式進行統一建模。這樣的設計不僅優化了語音識別和生成的流程，也爲 AI 賦予了更爲豐富的 “靈魂”，使其能夠更好地與人類進行交流。

豆包的實時語音大模型在中文語音對話領域的推出，將會爲用戶提供前所未有的交互體驗，推動智能語音技術的發展。

階躍星辰推出 StepAudio 2.5 Realtime，實時語音 AI 再升級！

階躍星辰發佈新一代實時語音大模型StepAudio 2.5 Realtime，已全面上線並開放給開發者。該模型通過提升副語言感知、人設自定義和對話能力，提供更真實的對話體驗。核心創新在於處理語調、語速、停頓及嘆息等非文字信息，增強交互自然度。

階躍星辰發佈StepAudio 2.5 Realtime：賦予大模型真人般的情感與智慧

階躍星辰發佈新一代實時語音大模型StepAudio 2.5 Realtime，標誌着大模型交互從“文本對話”邁向“實時情感交流”的質變。該模型顯著提升了語音交互的自然度與智能化程度，實現“真人級”深度感知體驗，推動國產大模型在語音領域邁上新臺階。

豆包App視覺推理能力升級圖片分析支持深度思考

豆包App在視覺推理領域迎來重大升級，其圖片分析功能現已支持深度思考模式，爲用戶帶來前所未有的智能體驗。用戶只需在深度思考模式下拍攝或上傳一張圖片，豆包便能迅速對圖片進行放大、裁剪等精細處理，並支持圖片搜索功能，實現邊想邊搜，從而進一步提升搜索結果的準確性。

豆包App“一句話P圖”功能全新升級基於SeedEdit 3.0實現全面優化

今日，豆包App在智能修圖領域迎來重大升級，其“一句話P圖”功能基於最新圖像編輯模型SeedEdit3.0實現了全面優化，爲用戶帶來了更爲豐富多樣的修圖玩法。此次升級後的豆包App支持多種P圖操作，極大地滿足了用戶不同的修圖需求。用戶可以輕鬆實現一鍵添加或替換文字，爲照片增添獨特的文字元素，讓青春記憶變得“圖文並茂”，更具紀念意義。

豆包發佈實時語音大模型中文一流，雙商在線

相關推薦

不只是對話！豆包App內置地圖導航，AI大模型正全面滲透日常出行

階躍星辰推出 StepAudio 2.5 Realtime，實時語音 AI 再升級！

階躍星辰發佈StepAudio 2.5 Realtime：賦予大模型真人般的情感與智慧

豆包App視覺推理能力升級圖片分析支持深度思考

豆包App“一句話P圖”功能全新升級基於SeedEdit 3.0實現全面優化

豆包發佈實時語音大模型 中文一流，雙商在線

相關推薦

不只是對話！豆包App內置地圖導航，AI大模型正全面滲透日常出行

階躍星辰推出 StepAudio 2.5 Realtime，實時語音 AI 再升級！

階躍星辰發佈StepAudio 2.5 Realtime：賦予大模型真人般的情感與智慧

豆包App視覺推理能力升級 圖片分析支持深度思考

豆包App“一句話P圖”功能全新升級 基於SeedEdit 3.0實現全面優化

豆包發佈實時語音大模型中文一流，雙商在線

豆包App視覺推理能力升級圖片分析支持深度思考

豆包App“一句話P圖”功能全新升級基於SeedEdit 3.0實現全面優化