近日,科技媒體 macstories 通過一項實測,揭示了蘋果公司全新推出的 Speech API 的強大性能。通過轉錄一段長達34分鐘、大小爲7GB 的4K 視頻,該技術僅用時45秒完成轉錄,速度之快令人驚歎。
這項技術的推出是在2025年 WWDC 全球開發者大會上宣佈的,其中包括兩個重要模塊:SpeechAnalyzer 和 SpeechTranscriber。macstories 團隊使用了基於這些模塊開發的 Yap 應用工具,對其轉錄性能進行了詳細測試。結果顯示,Yap 在處理視頻時展現出了顯著的速度優勢,遠超目前市場上其他主流轉錄工具。
在與競爭對手的對比中,Yap 完成轉錄所需時間爲45秒,而 OpenAI 的 Whisper(MacWhisper V3Turbo 版本)則需要101秒,速度慢了55%。其他工具如 VidCap 和 MacWhisper V2的轉錄時間分別爲1分55秒和3分55秒,這進一步突顯了 Yap 的優勢。
儘管所有工具在專有名詞識別方面存在一定誤差,比如在轉錄 “AppStories” 時的識別不準確,但 Yap 的本地化運算能力使其在處理速度上具有無可比擬的優勢。這意味着,如果用戶每週處理多段視頻,使用 Yap 將節省大量時間,提升工作效率。
蘋果在轉錄技術領域的這一創新不僅提高了效率,也爲創作者、教育工作者和內容製作者帶來了便利。隨着這項技術的普及,未來我們可能會看到更多企業在視頻處理和內容生成方面的應用。總之,蘋果的這項新技術標誌着語音轉錄領域的一次革命,未來的內容生產將因其而變得更加高效與智能。