法國AI巨頭突襲多模態戰場：Mistral AI發佈開源圖文理解模型Pixtral 12B

Mistral AI再次震撼AI界，推出了首款開源多模態大模型Pixtral12B。這款能同時處理圖像和文本的模型不僅技術先進，更以其開放態度引發廣泛關注。Mistral AI直接將模型權重公開上網，甚至貼心地提供了磁力鏈接。

Pixtral12B的亮點不僅在於其強大的功能，更在於其精巧的設計。模型總體積僅爲23.64GB，在多模態模型中可謂輕量級選手。這一特性大大降低了能耗和部署門檻，讓更多開發者和研究人員能夠輕鬆上手。據悉，擁有高速網絡的用戶僅需幾分鐘即可完成下載，極大地提高了模型的可訪問性。

作爲Mistral AI的最新力作，Pixtral12B基於其文本模型Nemo12B開發而成，擁有120億參數。它的能力堪比Anthropic的Claude系列和OpenAI的GPT-4等知名多模態模型，能夠理解並回答各種與圖像相關的複雜問題。

在技術規格上，Pixtral12B同樣令人印象深刻:40層網絡結構、14，336個隱藏維度、32個注意力頭，以及400M的專用視覺編碼器，支持處理1024x1024分辨率的圖像。

更值得一提的是，Pixtral12B在多項權威基準測試中表現出色。在MMMU、Mathvista、ChartQA、DocVQA等平臺上，它的成績超越了包括Phi-3和Qwen-27B在內的多個知名多模態模型，充分證明了其強勁的實力。

Mistral AI此舉無疑將進一步推動多模態模型的開源浪潮。社區對這一新模型反響熱烈，許多開發者和研究人員已迫不及待地開始探索Pixtral12B的潛力。這不僅體現了開源社區的活力，也預示着多模態AI技術可能迎來新一輪的創新熱潮。

隨着Pixtral12B的發佈，我們有理由期待更多創新應用的出現。無論是在圖像理解、文檔分析，還是跨模態推理等領域，這款模型都可能帶來突破性的進展。Mistral AI的這一舉措，無疑爲AI技術的民主化和普及化貢獻了重要力量，讓我們拭目以待它在未來將如何重塑AI領域的格局。

huggingface地址:https://huggingface.co/mistral-community/pixtral-12b-240910

法國憑藉低價電力在 AI 競爭中脫穎而出

在G7峯會上，法國AI公司Mistral AI的CEO Arthur Mensch指出，法國憑藉大規模核電帶來的豐富且低成本電力，在AI競爭中具備優勢。法國是歐洲主要電力出口國，去年向意大利、德國、比利時淨出口92太瓦時電力。他強調電力是驅動人工智能發展的關鍵要素。

三星擬擲 10 億歐元押注Mistral：歐洲AI獨立的底氣，正被資本重新定價