在屏幕交互漸顯疲態之際,科技巨頭正集體轉向一個更自然、更沉浸的交互範式——語音。據《The Information》最新披露,OpenAI已祕密整合多個工程、產品與研究團隊,全力重構其音頻AI系統,爲一款預計2026年推出的音頻優先個人設備鋪路。這不僅是一次技術升級,更是OpenAI對“後屏幕時代”人機交互終局的明確押注。

 從“輔助功能”到“核心交互”:OpenAI重構音頻戰略

新音頻模型預計將於2026年初發布,將實現三大突破:

- 更自然的語音合成,接近人類語調與節奏;

- 支持真實對話式打斷——用戶可隨時插話,AI能即時響應;

- 首次實現“邊聽邊說”(concurrent speech)能力,即在用戶說話時同步輸出反饋,打破當前AI“說完才能聽”的僵化交互模式。

更重要的是,OpenAI正規劃一系列音頻優先硬件產品,可能包括無屏智能音箱、AI眼鏡或可穿戴設備,目標不是成爲工具,而是用戶的“智能伴侶”。

 行業共振:語音正成下一代入口

OpenAI並非孤例,整個科技生態正加速向音頻遷移:

- Meta 爲Ray-Ban智能眼鏡配備五麥克風陣列,實現嘈雜環境下的定向聆聽;

- Google 推出“Audio Overviews”,將搜索結果轉化爲對話式語音摘要;

- Tesla 將xAI的Grok聊天機器人深度集成至車載系統,通過自然語言控制導航、空調等全車功能;

- 初創公司如Sandbar、前Pebble創始人Eric Migicovsky的新公司,均計劃於2026年推出AI語音戒指,實現“擡手即對話”。

即便Humane AI Pin、Friend AI項鍊等早期嘗試遭遇滑鐵盧,市場仍堅信:語音是通往無感、無縫、無屏智能體驗的關鍵路徑。

 Jony Ive入局:用音頻“修正”科技成癮

值得注意的是,OpenAI的硬件願景深受前蘋果設計靈魂人物Jony Ive影響。今年5月,OpenAI以65億美元收購Ive的公司LoveFrom(報道中稱“io”),將其引入硬件團隊。Ive公開表示,希望借音頻優先設計“糾正過去消費電子設備製造的錯誤”——即減少屏幕依賴、緩解數字成癮,讓技術迴歸服務人性的本質。

 AIbase觀察:語音戰爭,本質是“注意力爭奪”

當每個空間——客廳、駕駛艙、手腕、甚至眼鏡——都成爲語音交互入口,競爭已超越技術本身,直指人類最稀缺的資源:注意力。  

OpenAI的野心,不只是讓ChatGPT“說得更好”,而是讓AI無處不在卻又不可見,通過聲音融入生活流,成爲用戶思維的延伸。

若成功,OpenAI或將定義繼智能手機之後的下一代個人計算平臺。而這場靜默卻深刻的“語音革命”,正從一句“Hey, ChatGPT…”悄然開始。