近日,英偉達宣佈與大型語言模型開發商 Mistral AI 達成合作,旨在加速開發和部署一系列新的開放源模型。根據雙方的合作協議,英偉達將利用其強大的平臺來支持 Mistral 最新推出的模型家族 ——Mistral 3。
Mistral 3 系列被描述爲開放源、多語言和多模態的,且針對英偉達的超級計算和邊緣平臺進行了優化。該模型採用混合專家(MoE)架構,這種架構的特點是隻有與特定任務相關的部分會被激活,從而實現更高效和更精確的部署。英偉達表示,結合其 GB200 NVL72 系統與 Mistral 的 MoE 架構,將使企業能夠更高效地部署和擴展大型模型,充分利用 “先進的並行性” 和硬件優化。
Mistral 3 模型具有 410 億個活躍參數、6750 億個總參數以及 256K 的大上下文窗口,能夠爲企業 AI 工作負載提供良好的可擴展性、效率和適應性。雙方還透露,該新模型將於 12 月 2 日全面上線,可在雲端、數據中心及邊緣設備上使用。
此次合作還延續了兩家公司之前的合作基礎,包括爲聊天機器人和編碼任務開發的 Mistral NeMo 12B 語言模型。此外,Mistral 還發布了九個小型語言模型,旨在幫助開發者在各種設備上運行 AI。這些模型設計用於在英偉達的硬件上運行,包括 Spark、RTX PC 和筆記本電腦,以及 Jetson 設備。開發者可以通過 AI 框架 Llama.cpp 和 Ollama 訪問這些模型。
Mistral 3 家族對研究人員和開發者開放,這一舉措被認爲是幫助 “民主化” 前沿 AI 的努力。值得一提的是,英偉達還在同一周內宣佈對芯片製造商 Synopsys 投資 20 億美元,這進一步強調了公司在 AI 和計算領域的實力。
劃重點:
🌟 英偉達與 Mistral AI 合作,推出開放源的 Mistral 3 模型家族,旨在提高 AI 模型的開發和部署效率。
🔍 Mistral 3 系列採用混合專家架構,具備 410 億活躍參數和 6750 億總參數,適用於企業 AI 應用。
💻 同時發佈的九個小型語言模型支持多種硬件,推動 AI 技術的普及和應用。
