法國人工智能實驗室 Mistral 近日正式推出了其首個推理模型系列 ——Magistral,標誌着其在 AI 領域的又一重要進展。該系列包含兩個版本:Magistral Small 和 Magistral Medium,旨在提升在數學和物理等領域的邏輯推理能力。這些模型通過分步驟解決問題,與 OpenAI 的 o3模型和谷歌的 Gemini2.5Pro 等其他推理模型不無相似之處。

mistral

Magistral Small 的參數達到240億,並已在人工智能開發平臺 Hugging Face 上開放下載,採用 Apache2.0許可證,方便開發者使用。而 Magistral Medium 則是一個更強大的版本,目前處於預覽階段,用戶可以通過 Mistral 的 Le Chat 聊天平臺、公司 API 及第三方合作伙伴的雲服務進行體驗。

Mistral 在其官方博客中指出,Magistral 適用於多種企業級應用,包括結構化計算、程序邏輯和基於規則的系統。通過多步驟邏輯的微調,Magistral 能夠增強可解釋性,並向用戶提供可追溯的思考過程,這對於很多需要高透明度的行業尤爲重要。

image.png

儘管 Mistral 在資金和技術上具備一定實力,近年來卻在推理模型的開發上落後於一些頂尖實驗室。根據自家基準測試,Magistral 在評估物理、數學和科學能力的 GPQA Diamond 和 AIME 測試中表現不如 Gemini2.5Pro 和 Claude Opus4。而在編程基準測試 LiveCodeBench 中,Magistral Medium 同樣未能超越 Gemini2.5Pro 的成績。

儘管如此,Mistral 依舊強調 Magistral 的獨特優勢。該模型在 Le Chat 平臺上的答題速度是競爭對手的10倍,並且支持包括意大利語、阿拉伯語、俄語和簡體中文等多種語言。此外,Mistral 表示,Magistral 專爲研究、戰略規劃、運營優化及數據驅動決策而設計,能夠在多因素風險評估和建模方面大顯身手。

Magistral 的推出也正值 Mistral 發佈 “氛圍編程” 客戶端 Mistral Code 之後,顯示出該公司在編程和企業服務領域的進一步佈局。