正文

主打極致低延遲！Mistral 推出全新語音轉文字 AI 模型

aibase

發布於AI新閒資訊

時間 :Feb 11, 2026

閱讀 :1分鐘

法國 AI 領軍企業 Mistral AI 正式發佈了兩款全新的語音轉文字（Speech-to-Text）模型，旨在重新定義轉錄速度、隱私保護與性價比的行業標準。

此次推出的模型包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime，均隸屬於 Voxtral Transcribe2體系。這兩款模型可提供頂級的轉錄質量、說話人識別（Diarization）以及極低的延遲表現，適用於虛擬助手、呼叫中心自動化及合規記錄等多種商業場景。

核心產品亮點:

Voxtral Realtime（實時處理）: 專爲直播音頻設計，採用創新的流式架構。其延遲最低可配置爲 200毫秒。在480毫秒的延遲下，錯誤率僅爲1%-2%，幾乎等同於離線轉錄精度。該模型僅有40億參數，支持在手機或筆記本電腦等本地設備上運行，極大保障了隱私安全。目前已在 Hugging Face 平臺以 Apache2.0協議開源，API 價格爲 0.006美元/分鐘。
Voxtral Mini Transcribe2（批量處理）: 專門處理預錄音文件。它支持長達3小時的單次請求，並具備精準的說話人標註和時間戳功能。其在 FLEURS 詞錯率基準測試中表現優異，而 API 價格僅爲 0.003美元/分鐘，被 Mistral AI 稱爲目前市場上性價比最高的轉錄方案。

兩款模型均原生支持包括中文、英語、法語、日語在內的13種語言。用戶目前已可在 Mistral AI 的 Audio Playground 或 Le Chat 助手上進行體驗。

劃重點:

🚀 極致性能:實時模型延遲低至200ms，離線模型具備極高的詞錯率（WER）優勢。
🔒 本地化部署:4B 參數量的輕量化設計支持在本地設備運行，無需上傳雲端，確保隱私安全。
💰 高性價比:批量轉錄 API 低至每分鐘0.003美元，力求在企業市場建立價格優勢。
🌍 多語言支持:原生支持全球13種主流語言，涵蓋絕大部分商業應用場景。

相關推薦

Kimi K3 攻防考卷翻車：漏洞利用只到美國前沿模型四成，蒸餾疑雲被安全機構擺上臺

英美AI安全機構聯合評測Kimi K3：在漏洞利用和模擬網絡攻擊能力上遜於美國前沿模型，但優於智譜GLM-5.2，成爲開放權重模型中的新標杆。

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

Runway推出Media Router，可依據質量、速度與成本優先級，爲圖像、視頻、音頻生成自動切換AI模型。系統將調用場景分爲三類，如高速生成模式用於快速創意驗證，實現智能匹配，省去開發者逐一比較和手動切換的負擔，兼顧效率與成本。

小鵬人形機器人廣州工廠開啓小批量試生產預計2026年實現量產

近日，小鵬人形機器人在廣州工廠正式開啓小批量試生產，量產產線已進入最後聯調，標誌着量產衝刺進入倒計時。集團董事長何小鵬已親自兼任機器人業務CEO，全面統籌並推進商業化落地進程。按照內部機器人量產動員大會規劃，公司將於2026年正式實現人形機器人量產，並計劃

快手入局AI互動內容賽道，開放首批創作者招募

快手推出“AI互動內容”創作功能，招募首批創作者，聚焦AI互動劇情、角色對話和輕應用。這標誌着短視頻平臺競爭從傳統內容時長轉向交互式體驗，入選者可優先體驗工具並與團隊共同打磨產品。

Google Q2 資本開支翻番破紀錄：449 億美元砸向 AI 基建，雲業務利潤率幾乎翻倍

Alphabet二季度資本支出同比暴漲100%至449.2億美元，年化逼近1800億美元；營收增24%至1198億美元，超預期。谷歌雲營收飆升82%至248億美元，運營利潤率近乎翻倍，鉅額算力投入正轉化爲強勁盈利引擎。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase