近日,階躍星辰正式發佈了新一代實時語音大模型 StepAudio 2.5 Realtime。該模型現已全面上線,開發者可以通過階躍星辰開放平臺進行接入。StepAudio 2.5 Realtime 旨在爲用戶提供更爲真實的對話體驗,圍繞副語言感知、人設自定義和對話能力進行了全面的技術提升。

image.png

StepAudio 2.5 Realtime 的核心創新在於其對副語言信息的處理能力。副語言包括語調、語速、停頓,以及嘆息或輕笑等非文字表達方式,這些細節是傳遞情感的關鍵。通過分析這些元素,模型能夠感知用戶的情緒和潛在意圖,例如從低沉的聲調中識別出疲憊,或從急促的語速中判斷出煩躁情緒,並據此動態調整回覆的語氣與策略,提升交流的自然感。

在人設自定義方面,StepAudio 2.5 Realtime 允許開發者進行靈活調節。用戶可以通過 API 調整 AI 角色的性格特徵、背景經歷以及語言習慣等。該模型基於超過 10,000 個高質量原生人設,經過算法生成了百萬級的人設特徵矩陣,並通過大量真實對話數據進行訓練。開發團隊還進行了強化學習優化,確保模型在極端場景下保持穩定的角色一致性。此外,模型內置了 5 個預設人設,供用戶直接體驗。

在整體對話能力上,StepAudio 2.5 Realtime 強調智商與情商的雙重提升。除了能夠深入理解複雜語義、應對交流中的各種情境外,模型還能夠調用多領域知識,提供更深層次的對話體驗,既能作爲情感交流的聊天夥伴,也能模擬專業 HR 進行面試等正式場合。

根據官方最新評測數據顯示,該模型在五個測試維度中表現卓越,特別是在用戶體驗評分中,StepAudio 2.5 Realtime 的得分達到 80.41,顯著高於其他同類產品,如 GPT-Realtime-1.5 和 Gemini Live,展示了其強大的性能和應用潛力。

劃重點:  

🌟 StepAudio 2.5 Realtime 具備先進的副語言處理能力,能精準感知用戶情緒。  

🎭 用戶可通過 API 自定義 AI 角色的性格與背景,提升交互個性化。  

📊 官方評測顯示,該模型在多項測試中表現優異,得分遠超同類產品。