ChatGPT Android應用迎來重要更新,新增語音模式字幕功能。用戶現可通過點擊界面上的“三點”菜單並選擇“顯示字幕”選項,在語音交互時實時查看對話的文本轉錄。這一功能顯著提升了語音模式的易用性和可訪問性,尤其適合嘈雜環境或聽力受限用戶。AIbase觀察到,此更新進一步優化了ChatGPT在移動端的用戶體驗,鞏固了其在AI語音交互領域的領先地位。

image.png

操作簡便,字幕無縫集成

新上線的字幕功能操作極爲簡便。用戶在ChatGPT Android應用的語音模式中,只需點擊右上角“三點”菜單,選擇“顯示字幕”,即可在屏幕上同步顯示語音對話的實時轉錄。AIbase瞭解到,字幕功能基於OpenAI的Whisper語音轉文本技術,能夠精準捕獲用戶語音輸入和ChatGPT的響應內容。社交媒體反饋顯示,用戶對字幕的清晰度和實時性給予高度評價,認爲其爲語音交互增添了實用性和包容性。此外,字幕內容在對話結束後會自動保存至聊天曆史,方便用戶隨時回顧。

後臺監聽優化,交互更自然

此次更新還優化了ChatGPT的後臺監聽功能。用戶可在語音模式下讓ChatGPT保持後臺運行,即使暫時停止對話,模型仍會持續監聽。一旦用戶再次開口(如說出單個詞語),ChatGPT將立即響應,繼續對話,無需重新激活語音模式。AIbase編輯團隊注意到,這一功能雖非全新,但其流暢性和響應速度得到了顯著改進,特別適合需要間歇性交互的場景,如開車或處理多任務時。社交媒體用戶表示,後臺監聽讓語音交互更加自然,彷彿與“數字助手”進行無縫對話。

語音交互的競爭升級

ChatGPT語音模式的字幕功能發佈,正值AI語音助手市場的競爭日益激烈。近期,Google Gemini Live和Microsoft C opilot Voice也推出了類似的可視化交互改進,試圖通過多模態功能吸引用戶。AIbase分析認爲,ChatGPT通過字幕和後臺監聽的優化,不僅提升了用戶體驗,還在可訪問性和實時性上樹立了新標杆。據OpenAI官方數據,ChatGPT移動端語音模式自2023年11月向免費用戶開放以來,已吸引數百萬用戶,Plus用戶更可享受基於GPT-4o的高級語音功能,包括情緒感知和低延遲響應。

語音交互的未來趨勢

ChatGPT Android應用的字幕功能和後臺監聽優化,標誌着AI語音交互向更智能、更包容的方向邁進。AIbase編輯團隊預計,OpenAI未來可能進一步整合視頻、屏幕共享等功能(如已在iOS和Android高級語音模式中推出的功能),打造真正的多模態AI助手。同時,字幕功能的普及或將推動語音交互在教育、客服和無障礙場景的廣泛應用。