最近,法國人工智能初創公司 Mistral AI 宣佈了他們的新一代語言模型 ——Ministral3B 和 Ministral8B。

這兩款新模型是 “Ministraux” 系列的一部分,專爲邊緣設備和邊緣計算場景而設計,支持高達128,000個 token 的上下文長度。這意味着這些模型不僅處理能力強大,而且可以在數據隱私和本地處理尤爲重要的情況下使用。

image.png

Mistral 表示,Ministraux 系列模型非常適合於一系列應用,例如本地翻譯、離線智能助手、數據分析以及自主機器人技術。爲了進一步提升效率,Ministraux 模型還可以與更大的語言模型(比如 Mistral Large)結合使用,作爲多步驟工作流中的有效中介。

在性能上,Mistral 提供的基準測試顯示,Ministral3B 和8B 在多個類別中都超過了許多同類模型,比如歌的 Gemma22B 和 Meta 的 Llama3.18B。值得一提的是,儘管 Ministral3B 的參數數量較少,但在某些測試中,它的表現超越了其前身 Mistral7B。

實際上,Mistral8B 在所有測試中都表現優異,尤其是在知識、常識、功能調用和多語言能力等方面。

關於定價,Ministral AI 的這兩款新模型已經可以通過 API 獲取。Ministral8B 的費用爲每百萬個 token0.10美元,而 Ministral3B 則是0.04美元。此外,Mistral 還爲研究用途提供了 Ministral8B Instruct 的模型權重。值得注意的是,Mistral 的這兩款新模型很快也會通過谷歌 Vertex 和 AWS 等雲合作伙伴上線。

劃重點:

- 🚀 Mistral AI 推出 Ministral3B 和8B,支持高達128,000個 token 的上下文長度。

- 💡 這兩款模型適合本地翻譯、離線助手、數據分析和自主機器人等應用。

- 💰 定價方面,Ministral8B 每百萬 token 費用爲0.10美元,Ministral3B 爲0.04美元。