法國 AI 初創公司 Mistral 近日宣佈推出了一系列新的生成式 AI 模型,這些模型專爲邊緣設備設計,比如筆記本電腦和手機。Mistral 將這系列模型命名爲 “Les Ministraux”,旨在滿足市場上對本地處理和隱私優先的需求。

image.png

新發布的 Les Ministraux 系列包括兩個模型:Ministral3B 和 Ministral8B。值得注意的是,這兩個模型的上下文窗口達到了128,000個 token,能夠處理大約50頁書的文本長度。這意味着無論是文本生成、在設備上進行翻譯,還是提供離線的智能助手服務,這些模型都能應對自如。

Mistral 在其博客中表示,越來越多的客戶和合作夥伴正在尋求能夠在本地進行推理的解決方案,這些方案涉及到重要的應用場景,如設備上的翻譯、本地分析和自主機器人等。Les Ministraux 正是爲了在這些場景中提供計算高效、低延遲的解決方案而開發的。

目前,Ministral8B 已可供下載,但僅限於研究目的。希望獲取 Ministral3B 或 Ministral8B 商業使用許可的開發者和公司需要直接聯繫 Mistral。同時,開發者也可以通過 Mistral 的雲平臺 La Platforme,以及未來幾周內與其合作的其他雲服務使用這兩個模型。Ministral8B 的收費標準爲每百萬個輸入 / 輸出 token10美分,而 Ministral3B 則爲4美分。

最近,小型模型的趨勢愈演愈烈,因爲它們的訓練、微調和運行成本更低且速度更快。谷歌在其 Gemma 小型模型系列中持續添加新模型,而微軟則推出了 Phi 系列模型。Meta 也在最新的 Llama 系列更新中推出了多個針對邊緣硬件優化的小型模型。

Mistral 聲稱,Ministral3B 和 Ministral8B 在多個旨在評估指令遵循和問題解決能力的 AI 基準測試中,表現超越了同類的 Llama 和 Gemma 模型,以及其自身的 Mistral7B 模型。Mistral 總部位於巴黎,最近成功融資6.4億美元,正在逐步擴展其 AI 產品組合。過去幾個月,該公司推出了一項免費的服務,允許開發者測試其模型,併發布了一個 SDK,以便客戶能夠微調這些模型。此外,還推出了一個名爲 Codestral 的代碼生成模型。

Mistral 的共同創始人來自 Meta 和谷歌的 DeepMind,公司的目標是創建能夠與 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 等頂尖模型相媲美的旗艦模型,並在此過程中實現盈利。儘管 “盈利” 這一目標對於許多生成式 AI 初創公司來說都頗具挑戰性,但 Mistral 據報道已經在今年夏天開始實現收入。

劃重點:

1. 🚀 Mistral 推出的 Les Ministraux 系列模型專爲邊緣設備設計,支持本地隱私處理。

2. 💡 新模型包含 Ministral3B 和 Ministral8B,具備超強的上下文處理能力,適用於多種應用場景。

3. 💰 Mistral 已開始盈利,並不斷擴展其 AI 產品組合,致力於與行業頂尖模型競爭。