可穿戴設備迎來“感知革命”。中國AI聲學領軍企業聲智科技(SoundAI)宣佈,其全球首款多模態AI時尚耳機將於海外知名衆籌平臺Kickstarter全球首發。該產品突破傳統耳機僅限音頻交互的侷限,創新性融合視覺感知與聲學交互,定位爲用戶的“隨身感知工具”,讓AI真正“看得見、聽得清、回得準”。

聲視融合:用眼睛看,用耳朵說

不同於普通AI耳機僅依賴麥克風陣列,聲智此次產品搭載微型視覺傳感器與自研多模態大模型,實現“視覺場景驗證 + 聲學結果交付”的閉環體驗:  

- 視覺端:通過輕量級攝像頭或環境光感知,識別用戶所處場景(如咖啡館、會議室、街道);  

- 聲學端:基於場景智能優化降噪策略、語音喚醒靈敏度及TTS輸出音色;  

- 交互閉環:例如在嘈雜街道,耳機識別“戶外”後自動增強語音收聽清晰度;進入會議室則切換至“靜音模式”,僅通過骨傳導提示日程。

該設計有效解決純語音AI在複雜環境中的誤觸發與響應失準問題,顯著提升交互可靠性。

全棧聲學底座,軟硬一體賦能

產品依託聲智科技自研的全棧聲學技術體系,涵蓋遠場語音識別、聲源定位、回聲消除、個性化聲紋建模等核心技術,並集成其多模態大模型推理引擎,可在端側完成低延遲場景理解,保障用戶隱私與響應速度。

時尚設計+全球首發,瞄準高端消費市場

作爲“時尚耳機”,產品由國際設計團隊操刀,兼顧美學與佩戴舒適性,目標用戶爲科技愛好者、商務人士與數字遊民。選擇Kickstarter首發,旨在借力全球早期用戶反饋,快速迭代並建立海外品牌認知。

AIbase認爲,聲智科技此舉標誌着AI可穿戴設備從“語音助手”向“環境感知智能體”躍遷。當耳機不僅能聽指令,還能“看懂”你所處的世界,人機交互的自然性與主動性將實現質的飛躍。而這場由聲智掀起的“聲視融合”浪潮,或將成爲下一代智能硬件的關鍵入口。