Mistral AI近日宣佈推出其最新一代大型語言模型Mistral Large2,這一模型在成本效益、速度和性能方面都取得了顯著突破。
模型概況
Mistral Large2是一個擁有1230億參數的模型,具有128K的上下文窗口。它支持包括英語、法語、德語、西班牙語、意大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語在內的數十種語言,以及Python、Java、C、C++、JavaScript和Bash等80多種編程語言。
性能亮點

通用性能:在MMLU測試中,Mistral Large2的預訓練版本達到了84.0%的準確率。


代碼和推理能力:在代碼生成和數學推理方面,Mistral Large2的表現與GPT-4、Claude3Opus和Llama3405B等領先模型相當。

多語言能力:在多語言MMLU基準測試中,Mistral Large2展現出卓越的多語言處理能力,特別是在英語、法語、德語等主要語言上表現出色。
指令跟隨和對齊:在MT-Bench、Wild Bench和Arena Hard等基準測試中,Mistral Large2顯著提升了指令跟隨和對話能力。
工具使用和函數調用:模型經過訓練,能夠熟練執行並行和順序函數調用,爲複雜的商業應用提供強大支持。
技術特性
大幅減少"幻覺"現象,提高輸出的可靠性和準確性。
增強了模型在無法找到解決方案或信息不足時的自我認知能力。
注重生成簡潔且切中要點的回答,提高交互效率和成本效益。
應用和可用性
Mistral Large2現已在la Plateforme上以"mistral-large-2407"的名稱提供服務。
模型權重已開放,並託管在HuggingFace上。
Mistral AI與Google Cloud Platform擴大合作,通過Vertex AI提供Managed API服務。
該模型還可通過Azure AI Studio、Amazon Bedrock和IBM watsonx.ai等雲服務提供商訪問。
許可和使用條件
Mistral Large2在Mistral Research License下發布,允許用於研究和非商業用途。商業用途需要獲取Mistral Commercial License。
這一新模型的發佈標誌着Mistral AI在大型語言模型領域取得了重大進展,爲人工智能應用開發者提供了更強大、更靈活的工具,有望推動各行各業的創新應用。
