Mistral AI團隊又悄悄搞了個大新聞。近日,他們發佈了一款名爲MathΣtral的數學模型,這不僅是對阿基米德2311週年的致敬,更是數學推理和科學發現領域的一次重大突破。

MathΣtral是一款專爲數學推理和科學發現設計的7B模型,擁有32k的上下文窗口,這意味着它能處理更長、更復雜的數學問題。在Apache2.0許可下開源,這爲學術界和開發者提供了極大的便利。

image.png

Mistral AI團隊將MathΣtral貢獻給科學界,希望加強在需要複雜、多步驟邏輯推理的高級數學問題上的研究。模型在STEM領域的專業特長,在各種行業標準基準測試中達到了同類別的先進推理能力。特別是在MATH基準測試中達到了56.6%,在MMLU基準測試中達到了63.47%。

MathΣtral最引人注目的是其推理能力。這個模型證明了,通過更多的推理時間計算,可以實現明顯更好的結果。在MATH基準測試中,通過多數投票,MathΣtral7B的得分高達68.37%,而在64名候選人中,通過強大的獎勵模型,得分更是達到了74.59%。

image.png

Mistral AI團隊的這一舉措,是公司支持學術項目的更廣泛努力的一部分。MathΣtral的發佈,是在與Project Numina合作的背景下產生的,體現了Mistral AI對學術研究的重視和支持。

MathΣtral是一個指導性模型,可以根據Mistral AI的文檔進行使用或微調。模型權重託管在HuggingFace上,現在,用戶可以使用misstral-inference嘗試MathΣtral,並使用misstral-finetune進行適配,以滿足特定需求。

Mistral AI的MathΣtral模型,不僅是技術上的一次飛躍,更是對數學和科學領域研究的一次深刻貢獻。隨着AI技術的不斷髮展,我們有理由相信,MathΣtral將爲數學推理和科學發現帶來更多的可能性和突破。

官網地址:https://mistral.ai/news/mathstral/