法國AI初創公司Les Ministraux 推出兩款全新輕量級模型Ministral3B和Ministral8B,專爲邊緣設備設計,參數分別爲30億和80億。這兩款模型在指令跟隨基準測試中表現出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B則在除代碼能力外其他方面均優於這兩個模型。

image.png

測試結果顯示,Ministral3B和Ministral8B的性能可媲美Gemma2和Llama3.1等開源模型。 這兩款模型都支持高達128k的上下文,並在知識、常識、推理、函數調用和效率方面爲低於10B參數的模型樹立了新的標杆。 Ministral8B還配備了滑動窗口注意機制,以實現更快、更高效的內存推理。 它們可以被微調到各種用例中,例如管理複雜的AI智能體工作流程或創建專門的任務助手。

image.png

研究人員對Les Ministraux模型進行了多項基準測試,涵蓋知識與常識、代碼、數學和多語言等方面。 在預訓練模型階段,Ministral3B在與Gema22B、Llama3.23B的比較中取得了最佳成績。 Ministral8B在與Llama3.18B、Mistral7B的比較中,除代碼能力外其他方面均表現最佳。 在微調後的指令模型階段,Ministral3B在不同基準測試中均取得最佳成績,Ministral8B僅在Wild bench上略遜於Gema29B。

image.png

image.png

Les Ministraux模型的推出爲用戶提供了高計算效率、低延遲的解決方案,滿足了越來越多用戶對關鍵應用程序本地優先推理的需求。 用戶可以將這些模型應用於設備上翻譯、無需聯網的智能助理以及自動機器人等場景。 Ministral8B的輸入輸出價格爲每百萬token0.1美元,Ministral3B則爲每百萬token0.04美元。

image.png

值得注意的是,Mistral 公司此前曾以磁力鏈接方式開源多款模型,並獲得AI社區的認可。 然而,該公司今年陷入爭議,因爲它不再像以前那樣開放。 有消息稱微軟將收購Mistral的部分股份並對其進行投資,這意味着Mistral的模型將在Azure AI上託管。 Reddit網友發現Mistral已從官網上刪除了關於開源的承諾。 該公司的一些模型也開始收費,包括此次發佈的Ministral3B和Ministral8B。

詳情:https://mistral.ai/news/ministraux/