在 AI 圈,馬斯克的速度總是讓人猝不及防。當地時間3月16日,馬斯克旗下人工智能初創公司 xAI 在社交平臺官宣:其大模型 Grok 的文本轉語音(TTS)API 現已正式上線

這意味着,開發者們現在可以將 Grok 那種帶有強烈個人色彩、甚至帶點“毒舌”和幽默的語調,集成到各種應用程序中。從智能助理到沉浸式播客生成,Grok 終於不再僅僅停留在屏幕的文字行間,而是擁有了真正的“嗓音”。

作爲xAI生態佈局的關鍵一環,語音功能的補齊標誌着Grok正從一個單一的文本交互引擎,進化爲更具擬人感的多模態助手。此前,OpenAI 的 GPT-4o 憑藉極度絲滑的語音交互驚豔全球,而馬斯克顯然不打算在這場“聽覺競賽”中掉隊。

除了 API 的密集更新,大模型行業的競爭態勢也愈發焦灼。在36氪 的24小時熱榜中,315曝光的大模型“投毒”黑產DeepSeek V4遲遲未發的懸念 依然佔據高位。當行業還在爲數據真實性和模型迭代速度頭疼時,xAI卻選擇在交互體驗上暴力加速。

當你的 App 裏也開始迴響Grok標誌性的犀利發言,這或許會成爲 AI 時代最獨特的個性化標籤。隨着語音 API 的開放,一場關於“誰的 AI 更好聽、更懂交流”的較量,已經全面拉開帷幕。