近日,其發佈了一款名爲StreetReaderAI的創新原型系統,旨在讓盲人及低視力用戶也能無障礙地“遊覽”Google街景——不再是被動接收信息,而是通過自然語言與虛擬環境實時互動,真正實現自主探索城市空間的自由。
多模態AI驅動,打造可對話的街景體驗
StreetReaderAI並非簡單的語音播報工具,而是一個深度融合計算機視覺、地理信息系統(GIS)與大語言模型的多模態AI系統。它能實時解析街景圖像內容,並結合精確的地理位置數據,生成結構化、情境化的語音描述。當用戶“置身”於某條街道時,系統會主動說明周邊環境:“您正面向一座紅磚建築,左側是咖啡館,右側是公交站,前方50米處爲十字路口。”

更關鍵的是,該系統支持智能對話交互。用戶無需記憶複雜指令,只需像與人交談一樣提問:“前面那棟樓是什麼?”“附近有銀行嗎?”“這條路通向哪裏?”AI便會基於當前視角和地圖數據,給出準確、連貫的回答,讓虛擬探索變得直觀而自然。
無障礙操作,賦予用戶真正的控制權
爲確保操作對視障用戶友好,StreetReaderAI設計了極簡的交互方式。用戶可通過語音命令或標準鍵盤按鍵自由控制視角旋轉、前進後退、切換街景點位,整個過程無需依賴屏幕或觸控界面。這種“語音+鍵盤”的雙模輸入,兼顧了不同用戶的使用習慣,真正實現了“所問即所見,所控即所行”。
科技向善:從工具到權利的轉變
長期以來,數字地圖和街景服務雖極大便利了大衆出行,卻因高度依賴視覺界面,將視障羣體排除在外。StreetReaderAI的出現,標誌着無障礙技術正從“輔助功能”升級爲“平等體驗”——它不只是提供信息,而是賦予用戶主動探索、理解並決策的能力。
儘管目前該系統仍處於原型階段,尚未集成至Google Maps正式產品線,但其技術路徑已展現出明確的落地潛力。AIbase分析認爲,隨着多模態大模型與空間計算技術的成熟,未來此類無障礙AI將不僅限於街景,還可拓展至室內導航、公共交通指引甚至遠程導覽等場景,真正構建一個“人人可感知、可參與”的數字世界。
科技的意義,不僅在於突破極限,更在於彌合鴻溝。StreetReaderAI或許只是第一步,但它照亮的方向,值得整個行業追隨。
