階躍語音模型位列全球評測前三，創下中國大模型聽感新高

在最新發佈的全球權威TTS（語音合成）評測榜單Artificial Analysis Speech Arena Leaderboard中，來自中國的階躍星辰(StepFun)展現出強勁實力。其語音生成模型StepAudio2.5TTS憑藉出色的聽感表現躋身全球前三，成爲目前該榜單中排名最高的中國大模型產品。

與傳統的實驗室數據指標不同，該榜單採用了更爲嚴苛的“盲測Elo評分機制”。在這種模式下，用戶在完全不知道模型身份的情況下，對兩段由同一文本生成的音頻進行主觀聽感評判。測試場景涵蓋了在線客服、知識分享、數字助手以及娛樂互動等真實生活片段。階躍星辰的勝出，意味着其生成的語音在真實用戶反饋中更具“人情味”，在語調自然度與表達感染力上已具備國際頂尖的競爭力。

目前，階躍星辰已密集發佈了StepAudio2.5系列的全鏈路模型，包括負責語音生成的TTS、主打高精度識別的ASR，以及最新上線的Realtime實時交互模型。其中，Realtime模型特別強調了“活人感”的營造，通過頂級的副語言能力和千萬人設的自定義功能，試圖爲用戶打造一個有溫度、有靈魂的AI聊天夥伴。

事實上，這家公司在語音AI領域的佈局早已鋪開。其開源原生推理模型Step Audio R1.1已在另一項全球語音推理榜單中連續四個月位居榜首;而另一款開源的情緒風格編輯模型Step Audio EditX，僅需3秒素材即可完成高質量的音色復刻，展現了極高的技術效率。

在技術落地的商業化路徑上，階躍語音模型也走在了前列。目前，該技術已成功搭載於吉利銀河M9等多款車型，實現了端到端語音大模型的量產上車。同時，在極氪8X等車型的智能交互系統中，該模型也作爲核心驅動力，爲整車智能體提供了更自然、流暢的交互體驗。

階躍星辰發佈 Step Edge 系列終端模型，實現本地高效多模態處理

階躍星辰發佈面向手機、車載等終端的Step Edge系列模型，包含基礎版、Audio版、GUI版及Gen版。該模型支持本地處理圖文音頻，能實現屏幕理解、語音識別、界面操作與圖像生成，工具調用延遲低至0.1秒。簡單、高頻或弱網場景下任務全在本地完成，複雜推理則交由雲端處理，實現端雲高效協同。

大模型公司造手機搶跑OpenAI:階躍星辰7月13日發首款AI智能體終端

階躍星辰將於7月13日召開發佈會，主題“Agent時代真正的智能體”，預計推出新一代智能體終端產品，或涵蓋AI終端品牌、智能體系統及首款AI智能體手機。此舉與OpenAI押注新一代AI終端的方向一致，顯示行業加速佈局智能體硬件。

階躍星辰將發佈全球大模型廠商首款AI智能體手機

階躍星辰將發佈全新AI終端品牌、智能體系統及首款AI智能體手機，成爲全球大模型廠商中率先實現智能體硬件落地的玩家。當前AI大模型加速向端側滲透，新一代AI終端已成戰略高地，OpenAI亦計劃2027年推出產品，階躍星辰此次搶跑佈局。

階躍語音模型位列全球評測前三，創下中國大模型聽感新高

相關推薦

階躍星辰發佈 Step Edge 系列終端模型，實現本地高效多模態處理

大模型公司造手機搶跑OpenAI:階躍星辰7月13日發首款AI智能體終端

階躍星辰首款AI智能體手機即將發佈，跑在OpenAI前面

階躍星辰將發佈全球大模型廠商首款AI智能體手機

國產大模型掀起新一輪上市潮，階躍星辰衝刺香港近年來最大AI IPO