法國人工智能實驗室 Mistral 近日宣佈正式推出其首個推理模型系列 ——Magistral。該系列包括 Magistral Small 和 Magistral Medium 兩個版本,旨在提升在數學、物理等學科領域的邏輯推理能力。Mistral 表示,Magistral 系列模型通過分步驟解決問題,以期提高結果的一致性和可靠性。

image.png

Magistral Small 版擁有240億個參數,並已在人工智能開發平臺 Hugging Face 上以 Apache2.0許可證開放下載。相較之下,Magistral Medium 版則擁有更強的能力,目前處於預覽階段,僅能通過 Mistral 的 Le Chat 聊天平臺、公司 API 及合作伙伴雲平臺進行訪問。

Mistral 在其官方博客中指出,Magistral 模型適用於多種企業級應用場景,包括結構化計算、程序化邏輯、決策樹和基於規則的系統。這些模型經過多步驟邏輯微調,能夠提供更高的可解釋性,並以用戶的語言展示可追溯的思考過程。

image.png

Mistral 成立於2023年,是一家前沿模型實驗室,致力於開發一系列人工智能驅動的服務,包括 Le Chat 和移動應用程序。公司已獲得 General Catalyst 等風險投資機構的支持,籌集資金超過11億歐元(約合90.22億元人民幣)。然而,在推理模型的開發方面,Mistral 仍落後於一些領先的人工智能實驗室。

根據 Mistral 自身的基準測試,Magistral 的競爭力似乎並不突出。在評估模型在物理、數學和科學領域技能的 GPQA Diamond 和 AIME 測試中,Magistral Medium 的表現不及 Gemini2.5Pro 和 Claude Opus4。此外,在編程基準測試 LiveCodeBench 中,Magistral Medium 同樣未能超過 Gemini2.5Pro。

儘管如此,Mistral 強調了 Magistral 在速度和多語言支持等方面的優勢。Mistral 聲稱,在 Le Chat 平臺上,Magistral 的答題速度是競爭對手的十倍,並且支持包括意大利語、阿拉伯語、俄語和簡體中文等多種語言。Mistral 在其博客中表示,Magistral 專爲研究、戰略規劃、運營優化和數據驅動決策而設計,能夠執行多因素風險評估、建模以及在約束條件下計算最優交付窗口等任務。

Magistral 的發佈正值 Mistral 推出 “氛圍編程” 客戶端 Mistral Code 之後不久。此外,幾周前 Mistral 還發布了多個專注於編程的模型,並推出了面向企業的聊天服務 Le Chat Enterprise,提供人工智能代理構建器等工具,並將 Mistral 的模型與 Gmail 和 SharePoint 等第三方服務集成。

官方博客:https://mistral.ai/news/magistral

劃重點:  

📊 Mistral 推出推理模型系列 Magistral,包括 Small 和 Medium 兩個版本。  

🚀 Magistral Small 已在 Hugging Face 開放下載,Medium 版目前處於預覽階段。  

🌍 模型支持多語言,答題速度是競爭對手的十倍,適用於多種企業應用場景。