正文

告別“你問我答”：ChatGPT 語音功能重磅升級，雙向實時對話時代開啓

發布於AI新閒資訊

時間 :Jun 24, 2026

閱讀 :1分鐘

人工智能的語音交互正在迎來一場“降維打擊”式的進化。近日，不少用戶在 ChatGPT 的網頁端及 App 端發現了一個名爲“Bidi1”的新型語音模型，預示着 OpenAI 正籌備開啓更大規模的測試，爲 AI 語音交互帶來前所未有的流暢體驗。

長期以來，AI 語音助手往往遵循着“我問、你答”的線性邏輯，用戶必須等待 AI 將上一段話完整輸出後，才能進行下一次互動。而 Bidi1語音模型的出現，徹底打破了這一桎梏。其核心亮點在於“雙向並行處理”:AI 不僅能在說話的同時實時監聽用戶的輸入，還能在對話進行到一半時，立即響應用戶的打斷或新指令。

這種交互模式極大地拉近了人機對話與真實人類溝通的距離。在演示案例中，當模型正在執行“從1數到10”的任務時，用戶隨時插話要求其“倒數”，模型能夠無縫銜接並立刻切換邏輯執行新指令。這種“邊聽邊回、實時響應”的交互邏輯，徹底告別了僵硬的等待週期，讓對話變得極其自然、絲滑。

在界面操作層面，Bidi1的辨識度也相當高。當用戶在設置的模型選擇器中選中該選項後，原有的語音氣泡將轉變爲醒目的黃色，以提示用戶當前已切換至這一高級語音模式。

雖然 OpenAI 官方尚未對此進行大範圍的正式發佈，但根據目前的測試反饋來看，這一功能的上線已經進入倒計時。從輔助工具到真正的對話夥伴，ChatGPT 的這一輪升級，不僅提升了語音交互的效率，更在人機協作的沉浸感上邁出了重要的一步。對於習慣通過語音處理事務的用戶而言，一個更懂“聽話”且反應迅捷的智能助手即將觸手可及。