法國人工智能初創公司Mistral AI週三宣佈全面進軍人工智能基礎設施領域,將其公司定位爲歐洲對美國雲計算巨頭的有力迴應。與此同時,該公司還推出了可與OpenAI最先進系統相媲美的新型推理模型。
這家總部位於巴黎的公司發佈了Mistral Compute,這是一個與英偉達(Nvidia)合作構建的綜合AI基礎設施平臺,旨在爲歐洲企業和政府提供替代方案,擺脫對亞馬遜網絡服務(AWS)、微軟Azure和谷歌雲(Google Cloud)等美國雲提供商的依賴。此舉標誌着Mistral AI的重大戰略轉變,從單純開發AI模型轉向掌控整個技術棧。
Mistral AI首席執行官兼聯合創始人Arthur Mensch表示:“進軍人工智能基礎設施領域標誌着Mistral AI邁出了轉型的一步,因爲它使我們能夠觸及人工智能價值鏈中一個關鍵的垂直領域。這一轉變意味着我們有責任確保我們的解決方案不僅能夠推動創新和人工智能的普及,還能維護歐洲的技術自主權,併爲其可持續發展領導力做出貢獻。”
Mistral如何構建能夠用任何語言思考的推理模型
除了基礎設施的宣佈,Mistral還發布了其Magistral系列推理模型——這些人工智能系統能夠進行逐步邏輯思考,類似於OpenAI的o1模型和中國的DeepSeek R1。然而,Mistral首席科學家Guillaume Lample表示,該公司的方法在關鍵方面與競爭對手有所不同。
Lample在一次獨家採訪中透露:“我們一切都是從零開始,主要是因爲我們想學習我們現有的專業知識,比如工作中的靈活性。實際上,我們在更強大的在線強化學習流程上做到了非常高效的水平。”與競爭對手經常隱藏推理過程不同,Mistral的模型會向用戶展示完整的思維鏈,並且至關重要的是,它使用用戶的母語,而不是默認的英語。Lample解釋說:“我們用用戶自己的語言,向用戶展示了完整的思維鏈,這樣他們就可以真正地閱讀,看看它是否有意義。”
該公司發佈了兩個版本:擁有240億個參數的開源模型Magistral Small;以及可通過Mistral API使用的更強大的專有系統Magistral Medium。
AI模型訓練中獲得的“超能力”
這些模型在訓練過程中展現出了令人驚喜的能力。最值得注意的是,儘管訓練過程僅側重於基於文本的數學和編碼問題,Magistral Medium仍保留了多模態推理能力——即分析圖像的能力。
Lample表示:“我們意識到,這並非完全是意外,而是我們絕對沒有想到的,如果在強化學習訓練結束時,你重新插入初始視覺編碼器,那麼你會突然發現,模型能夠對圖像進行推理。”
這些模型還獲得了複雜的函數調用能力,可以自動執行多步互聯網搜索和代碼執行來回答覆雜的查詢。Lample解釋道,模型會像進行網絡搜索一樣,然後處理結果,甚至在需要時再次搜索。這種行爲無需特殊訓練即可自然形成,這讓團隊感到“非常驚喜”。
工程突破:訓練速度遠超競爭對手
Mistral的技術團隊克服了重大的工程挑戰,創造了Lample所說的訓練基礎設施方面的突破。該公司開發了一套“在線強化學習”系統,使AI模型能夠在生成響應的同時不斷改進,而無需依賴現有的訓練數據。
關鍵創新在於實時同步數百個圖形處理單元(GPU)之間的模型更新。Lample解釋說:“我們所做的就是找到一種方法,只需通過GPU即可完成模型的遷移。”這使得系統能夠在幾秒鐘內(而不是通常需要的幾小時)在不同的GPU集羣之間更新模型權重。
Lample指出:“沒有哪個開源基礎設施能夠像它一樣妥善地做到這一點。通常情況下,有很多類似的開源嘗試來做到這一點,但速度極其緩慢。而在這裏,我們非常注重效率。”事實證明,訓練過程比傳統的預訓練更快、更便宜,Lample表示,用不了一週就能完成。
英偉達承諾爲歐洲AI獨立提供18,000塊芯片
Mistral Compute平臺將運行在18,000塊英偉達最新的Grace Blackwell芯片上,這些芯片最初部署在法國埃鬆省的一個數據中心,並計劃擴展到整個歐洲。英偉達首席執行官黃仁勳表示,此次合作對於歐洲的技術獨立至關重要。
黃仁勳在巴黎的聯合聲明中表示:“每個國家都應該在自己的國家建設人工智能,爲本國服務。通過Mistral AI,我們正在開發模型和人工智能工廠,作爲歐洲各地企業的自主平臺,幫助企業在各個行業擴展智能。”黃仁勳預測,未來兩年歐洲的人工智能計算能力將增長十倍,歐洲大陸將規劃超過20個“人工智能工廠”。
此次合作不僅限於基礎設施,還包括英偉達與其他歐洲人工智能公司以及搜索公司Perplexity合作,開發各種歐洲語言的推理模型,而這些語言的訓練數據通常有限。
解決AI的環境和主權問題
Mistral Compute解決了人工智能發展中的兩大問題:環境影響和數據主權。該平臺確保歐洲客戶能夠將其信息保存在歐盟境內並受歐洲管轄。
該公司與法國國家生態轉型機構和領先的氣候諮詢公司Carbone4合作,評估並儘量減少其人工智能模型在整個生命週期內的碳足跡。Mistral計劃使用脫碳能源爲其數據中心供電,並表示“通過選擇歐洲作爲我們的工廠所在地,我們能夠從大量脫碳能源中受益。”
速度優勢賦予Mistral推理模型實用優勢
早期測試表明,Mistral的推理模型不僅性能出色,而且解決了現有系統普遍存在的一個問題——速度。OpenAI和其他公司目前的推理模型可能需要幾分鐘才能響應複雜的查詢,這限制了它們的實際應用。
Lample指出:“人們通常不喜歡這種推理模型的一點是,儘管它很智能,但有時也會耗費大量時間。而在這裏,你實際上只需幾秒鐘就能看到輸出,有時甚至不到五秒,有時甚至更短。這改變了體驗。”速度優勢對於企業採用來說至關重要,因爲等待人工智能響應幾分鐘會造成工作流程瓶頸。
Mistral基礎設施投資對全球人工智能競爭的深遠影響
Mistral進軍基礎設施領域,使其與主導雲計算市場的科技巨頭展開直接競爭。該公司提供完整的垂直整合解決方案——從硬件基礎設施到AI模型再到軟件服務。這包括面向開發者的Mistral AI Studio、提升企業生產力的Le Chat和提供編程輔助的Mistral Code。
行業分析師認爲,Mistral的戰略是區域人工智能發展大趨勢的一部分。黃仁勳表示:“歐洲若想保持全球競爭力,就迫切需要擴大其人工智能基礎設施。”這與歐洲政策制定者的擔憂不謀而合。
這一聲明發布之際,歐洲各國政府越來越擔心其在關鍵人工智能基礎設施方面對美國科技公司的依賴。歐盟已承諾投入200億歐元,在歐洲大陸建設人工智能“超級工廠”,而Mistral與英偉達的合作或將加速這些計劃的實施。
Mistral宣佈推出基礎設施和模型功能,表明該公司致力於成爲一個全面的AI平臺,而不僅僅是一個模型提供商。在微軟和其他投資者的支持下,該公司已籌集超過10億美元,並將繼續尋求額外資金來支持其業務範圍的擴展。
Lample看到了推理模型未來更大的可能性,他表示:“當我觀察內部進展時,我認爲在一些基準測試中,該模型的準確率每週都在提高5%,大概持續了六週。所以它正在快速改進,有很多很多,我的意思是,你能想到的無數個小點子都能提升性能。”歐洲挑戰美國人工智能主導地位的舉措能否成功,最終可能取決於客戶是否足夠重視主權和可持續性,從而願意放棄現有供應商。至少目前,他們還有選擇。