語音 AI 領軍企業Speechify近日正式發佈原生 Windows 客戶端,標誌着其從單一的“文本轉語音”工具進化爲全棧語音助手。該應用通過集成三類本地 AI 模型,實現了跨應用的實時聽寫與文檔轉錄,直接對標 Superwhisper 等同類競品。

爲了確保極速響應併兼顧隱私,該應用在 Copilot+ PC 等高性能設備上支持完全本地化運行。用戶無需將音頻上傳雲端,即可利用本地 NPU 或 GPU 驅動的 Whisper 模型,完成高精度的語音輸入與會議總結。

image.png

硬件深度協同,三位一體模型驅動絲滑體驗

Speechify 在 Windows 端同步運行了三套核心算法:用於朗讀的神經網絡文本轉語音模型、實時檢測說話狀態的語音活動檢測(VAD)模型,以及負責精準轉錄的Whisper模型。這種“三位一體”的架構,確保了用戶在不同語速下都能獲得自然、流暢的交互反饋。

創始人 Cliff Weitzman 強調,針對職場用戶的迫切需求,新應用已打破了此前僅限瀏覽器的限制。無論是在 Word 文檔撰寫還是 Teams 視頻會議中,用戶都能通過系統級的快捷調用,實現“所聽即所得”的高效辦公。

鉅額融資加持,OpenAI 估值衝刺8520億美元

在 AI 硬件生態繁榮的同時,底層大模型廠商的資本神話仍在延續。據最新消息,OpenAI已完成一輪高達1220億美元的鉅額融資,投後估值飆升至驚人的8520億美元。

這筆資金將主要投向自研芯片、超大規模數據中心建設以及頂級人才儲備。隨着2026年 AI 算力成本的持續攀升,OpenAI 顯然正在通過史詩級的資本積累,試圖在通往 AGI(通用人工智能)的道路上構建不可逾越的競爭壁壘。