語音轉文字新標杆：ElevenLabs 奪冠，谷歌 Gemini 憑“全能”位居次席

Artificial Analysis 近日發佈了其語音轉文字（Speech-to-Text）基準測試的2.0版本(AA-WER v2.0)。測試結果顯示，ElevenLabs 與谷歌在音頻轉錄領域展現出極強的統治力。

在覈心的詞錯率（WER）指標上，ElevenLabs 推出的 Scribe v2 以 2.3% 的極低錯誤率位居榜首。緊隨其後的是谷歌的 Gemini3Pro，錯誤率爲 2.9%。值得注意的是，谷歌並未針對轉錄任務對 Gemini 進行專項訓練，這一優異表現完全得益於其強大的多模態通用能力。

其他主流模型表現如下:

Mistral Voxtral Small:以 3.0% 的錯誤率位列第三。
谷歌 Gemini3Flash:表現穩健，錯誤率爲 3.1%。
OpenAI Whisper Large v3:作爲最受歡迎的開源模型，此次以 4.2% 的錯誤率排在中游位置。
墊底陣營:阿里巴巴的 Qwen3ASR Flash（5.9%）、亞馬遜的 Nova2Omni（6.0%）以及 Rev AI（6.1%）在測試中排名靠後。

在專門針對語音助手指令的 AA-AgentTalk 測試中，排名格局依然穩定。ElevenLabs Scribe v2和 Google Gemini3Pro 分別以 1.6% 和 1.7% 的錯誤率遙遙領先，展現了在處理短促、直接的語音交互時的極高可靠性。

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

微軟內部AI操作系統Project Aion曝光，專爲AI PC打造。系統基於Edge與網頁輕量化技術，摒棄傳統開始菜單與桌面圖標，任務欄直喚Copilot成唯一交互入口。平臺聚焦信息流、創作與實時資訊，獨創“空間”功能可自動歸類網頁，交互邏輯徹底重構。

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

阿里巴巴內部發文，要求員工停止使用 Anthropic Claude 全系產品，包括 Sonnet、Opus、Fable 等模型及 Claude Code 等智能體工具，最後期限爲 7 月 10 日。此舉與公司年初開放 AI 使用、提供內部模型免費額度並報銷外部模型的政策形成對比，預示着其在 AI 工具策略上的收緊和向自研體系的迴歸。

Meta 出擊 AI 遊戲賽道：推出“靈感生成”新應用 Pocket

Meta近期在AI創作工具領域持續發力，繼繪圖與視頻工具後，悄然推出創意應用Pocket。用戶只需輸入文字提示，即可實時生成可互動的小型遊戲或應用“Gizmo”，如同一個將想法瞬間轉化爲可玩遊戲的生成器，體現了AI在交互式內容創作上的新探索。

語音轉文字新標杆：ElevenLabs 奪冠，谷歌 Gemini 憑“全能”位居次席

相關推薦

AI 智能體 Elements Claw 成功“閉環”超導材料研發

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

Meta 出擊 AI 遊戲賽道：推出“靈感生成”新應用 Pocket