Meta近日宣佈,推出其Llama系列的最新成員——Llama3.370B。Meta的生成式AI副總裁Ahmad Al-Dahle在X平臺上發佈了這一消息,並指出,Llama3.370B在性能上相較於Meta之前最大的Llama模型Llama3.1405B取得了顯著進步,同時成本大幅降低。

Al-Dahle表示,通過利用訓練後的最新技術,Llama3.370B不僅提升了性能,而且降低了運營成本。根據Meta發佈的基準測試結果,Llama3.370B在多個領域超過了谷歌的Gemini1.5Pro、OpenAI的GPT-4和亞馬遜新發布的Nova Pro,尤其在評估模型理解語言能力的MMLU測試中表現優異。

1733539490180.png

該模型現已可以從Hugging Face和Llama官方平臺等來源下載,Meta的這一舉措旨在通過“開放”模型來主導AI領域。Meta的Llama模型可以應用於多種場景,並支持商業化,雖然Meta對一些開發者設定了使用限制,要求每月用戶超過7億的平臺申請特別許可。儘管如此,Llama模型的下載量已突破6.5億次,表明其在全球AI開發者中受到了廣泛歡迎。

爲了支撐未來更大規模的AI模型訓練,Meta正在大力投資計算基礎設施。該公司近日宣佈將在路易斯安那州建設一個100億美元的AI數據中心,這是Meta迄今爲止規模最大的AI數據中心。扎克伯格在財報電話會議中提到,爲了訓練下一代Llama4模型,所需的計算能力將是Llama3的10倍。Meta目前已採購超過10萬個Nvidia GPU集羣,與xAI等競爭對手的資源相匹敵。

隨着生成式AI模型訓練的成本不斷攀升,Meta的資本支出也呈現增長趨勢,2024年第二季度的資本支出增長了近33%,達到了85億美元。這一增長主要得益於Meta在服務器、數據中心和網絡基礎設施上的持續投資。