Mistral AI發佈大型語言模型Mistral Large 2 接近Llama 405B

Mistral AI近日宣佈推出其最新一代大型語言模型Mistral Large2，這一模型在成本效益、速度和性能方面都取得了顯著突破。

模型概況

Mistral Large2是一個擁有1230億參數的模型，具有128K的上下文窗口。它支持包括英語、法語、德語、西班牙語、意大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語在內的數十種語言，以及Python、Java、C、C++、JavaScript和Bash等80多種編程語言。

通用性能:在MMLU測試中，Mistral Large2的預訓練版本達到了84.0%的準確率。

代碼和推理能力:在代碼生成和數學推理方面，Mistral Large2的表現與GPT-4、Claude3Opus和Llama3405B等領先模型相當。

多語言能力:在多語言MMLU基準測試中，Mistral Large2展現出卓越的多語言處理能力，特別是在英語、法語、德語等主要語言上表現出色。

指令跟隨和對齊:在MT-Bench、Wild Bench和Arena Hard等基準測試中，Mistral Large2顯著提升了指令跟隨和對話能力。

工具使用和函數調用:模型經過訓練，能夠熟練執行並行和順序函數調用，爲複雜的商業應用提供強大支持。

大幅減少"幻覺"現象，提高輸出的可靠性和準確性。

增強了模型在無法找到解決方案或信息不足時的自我認知能力。

注重生成簡潔且切中要點的回答，提高交互效率和成本效益。

Mistral Large2現已在la Plateforme上以"mistral-large-2407"的名稱提供服務。

模型權重已開放，並託管在HuggingFace上。

Mistral AI與Google Cloud Platform擴大合作，通過Vertex AI提供Managed API服務。

該模型還可通過Azure AI Studio、Amazon Bedrock和IBM watsonx.ai等雲服務提供商訪問。

Mistral Large2在Mistral Research License下發布，允許用於研究和非商業用途。商業用途需要獲取Mistral Commercial License。

這一新模型的發佈標誌着Mistral AI在大型語言模型領域取得了重大進展，爲人工智能應用開發者提供了更強大、更靈活的工具，有望推動各行各業的創新應用。