人工智能的語音交互正在迎來一場“降維打擊”式的進化。近日,不少用戶在 ChatGPT 的網頁端及 App 端發現了一個名爲“Bidi1”的新型語音模型,預示着 OpenAI 正籌備開啓更大規模的測試,爲 AI 語音交互帶來前所未有的流暢體驗。

長期以來,AI 語音助手往往遵循着“我問、你答”的線性邏輯,用戶必須等待 AI 將上一段話完整輸出後,才能進行下一次互動。而 Bidi1語音模型的出現,徹底打破了這一桎梏。其核心亮點在於“雙向並行處理”:AI 不僅能在說話的同時實時監聽用戶的輸入,還能在對話進行到一半時,立即響應用戶的打斷或新指令。

image.png

這種交互模式極大地拉近了人機對話與真實人類溝通的距離。在演示案例中,當模型正在執行“從1數到10”的任務時,用戶隨時插話要求其“倒數”,模型能夠無縫銜接並立刻切換邏輯執行新指令。這種“邊聽邊回、實時響應”的交互邏輯,徹底告別了僵硬的等待週期,讓對話變得極其自然、絲滑。

在界面操作層面,Bidi1的辨識度也相當高。當用戶在設置的模型選擇器中選中該選項後,原有的語音氣泡將轉變爲醒目的黃色,以提示用戶當前已切換至這一高級語音模式。

雖然 OpenAI 官方尚未對此進行大範圍的正式發佈,但根據目前的測試反饋來看,這一功能的上線已經進入倒計時。從輔助工具到真正的對話夥伴,ChatGPT 的這一輪升級,不僅提升了語音交互的效率,更在人機協作的沉浸感上邁出了重要的一步。對於習慣通過語音處理事務的用戶而言,一個更懂“聽話”且反應迅捷的智能助手即將觸手可及。