盲人也能“看見”街景？Google新AI系統讓虛擬探索無障礙，科技向善邁出關鍵一步

近日，其發佈了一款名爲StreetReaderAI的創新原型系統，旨在讓盲人及低視力用戶也能無障礙地“遊覽”Google街景——不再是被動接收信息，而是通過自然語言與虛擬環境實時互動，真正實現自主探索城市空間的自由。

多模態AI驅動，打造可對話的街景體驗

StreetReaderAI並非簡單的語音播報工具，而是一個深度融合計算機視覺、地理信息系統（GIS）與大語言模型的多模態AI系統。它能實時解析街景圖像內容，並結合精確的地理位置數據，生成結構化、情境化的語音描述。當用戶“置身”於某條街道時，系統會主動說明周邊環境:“您正面向一座紅磚建築，左側是咖啡館，右側是公交站，前方50米處爲十字路口。”

更關鍵的是，該系統支持智能對話交互。用戶無需記憶複雜指令，只需像與人交談一樣提問:“前面那棟樓是什麼?”“附近有銀行嗎?”“這條路通向哪裏?”AI便會基於當前視角和地圖數據，給出準確、連貫的回答，讓虛擬探索變得直觀而自然。

無障礙操作，賦予用戶真正的控制權

爲確保操作對視障用戶友好，StreetReaderAI設計了極簡的交互方式。用戶可通過語音命令或標準鍵盤按鍵自由控制視角旋轉、前進後退、切換街景點位，整個過程無需依賴屏幕或觸控界面。這種“語音+鍵盤”的雙模輸入，兼顧了不同用戶的使用習慣，真正實現了“所問即所見，所控即所行”。

科技向善:從工具到權利的轉變

長期以來，數字地圖和街景服務雖極大便利了大衆出行，卻因高度依賴視覺界面，將視障羣體排除在外。StreetReaderAI的出現，標誌着無障礙技術正從“輔助功能”升級爲“平等體驗”——它不只是提供信息，而是賦予用戶主動探索、理解並決策的能力。

儘管目前該系統仍處於原型階段，尚未集成至Google Maps正式產品線，但其技術路徑已展現出明確的落地潛力。AIbase分析認爲，隨着多模態大模型與空間計算技術的成熟，未來此類無障礙AI將不僅限於街景，還可拓展至室內導航、公共交通指引甚至遠程導覽等場景，真正構建一個“人人可感知、可參與”的數字世界。

科技的意義，不僅在於突破極限，更在於彌合鴻溝。StreetReaderAI或許只是第一步，但它照亮的方向，值得整個行業追隨。

盲人也能“看見”街景？Google新AI系統讓虛擬探索無障礙，科技向善邁出關鍵一步

相關推薦

蘋果發佈全新多模態 AI 模型 UniGen 1.5，實現圖像理解、生成與編輯三合一

前字節跳動視覺模型負責人潘欣加盟美團，主導多模態 AI 創新

ElevenLabs炸裂級更新：圖像、視頻、音樂一站式生成

文心大模型5.0重磅發佈！百度推全球首個“原生全模態”大模型，李彥宏：智能本身就是最大應用

一張合影就能泄露全家信息？央視緊急預警：“讀心AI”正讓社交曬圖變成隱私炸彈