OpenAI被曝正籌備發佈新一代雙向語音模型“GPT-Bidi-1”

OpenAI近日被曝光正在籌備推出名爲“GPT-Bidi-1”的下一代雙向音頻模型，旨在對其ChatGPT的語音模式進行重大升級。作爲該技術的核心突破，“GPT-Bidi-1”採用了雙向（Bidirectional）架構，徹底改變了以往AI語音交互中“單工對講”的侷限。該模型支持系統同時進行聆聽與表達，能夠實時捕捉用戶的插話與打斷，並在不發生卡頓或死機的情況下動態調整語義輸出，大幅提升了實時語音對話的自然度。

從目前的開發埋點來看，OpenAI已在Web端和移動端爲該模型的上線鋪設基礎代碼。在產品形態上，新功能上線後預計將與現有的高級語音模式（Advanced Voice Mode）並存，用戶可自主切換至“Bidi(最新)”模式。此外，該模型在文本側分級的基礎上，首度在語音端引入了“高(High)、中(Medium)、即時(Instant)”三種智力與速度分級，允許用戶根據具體任務在交互深度與響應速度之間做出權衡。

此次技術迭代不僅是單純的音質或語調升級，更是OpenAI在多模態戰略上的關鍵補齊。

此前，OpenAI的文本大模型已迭代至具有更強推理能力的GPT-5.5世代，而語音大模型則相對滯後，導致多模態體驗出現斷層。GPT-Bidi-1的推出不僅能夠補齊這一推理能力差距，更彰顯了OpenAI將語音視爲下一代AI核心入口的戰略野心，這也爲其後續全面佈局語音優先（Audio-first）的硬件設備及企業級語音支持工具奠定了關鍵的技術基石。

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

微軟內部AI操作系統Project Aion曝光，專爲AI PC打造。系統基於Edge與網頁輕量化技術，摒棄傳統開始菜單與桌面圖標，任務欄直喚Copilot成唯一交互入口。平臺聚焦信息流、創作與實時資訊，獨創“空間”功能可自動歸類網頁，交互邏輯徹底重構。

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

阿里巴巴內部發文，要求員工停止使用 Anthropic Claude 全系產品，包括 Sonnet、Opus、Fable 等模型及 Claude Code 等智能體工具，最後期限爲 7 月 10 日。此舉與公司年初開放 AI 使用、提供內部模型免費額度並報銷外部模型的政策形成對比，預示着其在 AI 工具策略上的收緊和向自研體系的迴歸。

Meta 出擊 AI 遊戲賽道：推出“靈感生成”新應用 Pocket

Meta近期在AI創作工具領域持續發力，繼繪圖與視頻工具後，悄然推出創意應用Pocket。用戶只需輸入文字提示，即可實時生成可互動的小型遊戲或應用“Gizmo”，如同一個將想法瞬間轉化爲可玩遊戲的生成器，體現了AI在交互式內容創作上的新探索。

OpenAI被曝正籌備發佈新一代雙向語音模型“GPT-Bidi-1”

相關推薦

AI 智能體 Elements Claw 成功“閉環”超導材料研發

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

Meta 出擊 AI 遊戲賽道：推出“靈感生成”新應用 Pocket