Meta推出開源大語言模型Llama 3.1 405B，性能堪比GPT-4

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 16, 2025

昨晚，Meta公司宣佈開源其最新大語言模型Llama3.1 405B。這一重磅消息標誌着經過一年的精心籌備，從項目規劃到最終審覈，Llama3系列模型終於與公衆見面。

Llama3.1405B是一個具有1280億參數的多語言工具使用模型。該模型在8K上下文長度預訓練後，進一步通過128K上下文長度持續訓練而成。根據Meta的說法，這個模型在多項任務中的表現可與業界領先的GPT-4相媲美。

相較於先前的Llama模型，Meta在多個方面進行了優化:

改進了預訓練數據的預處理和策劃流程
提升了訓練後數據的質量保證和篩選方法

405B模型的預訓練是一項巨大挑戰，涉及15.6萬億個標記和3.8x10^25次浮點運算。爲此，Meta優化了整個訓練架構，並調用了超過16，000塊H100GPU。

爲支持405B模型的大規模生產推理，Meta將其從16位（BF16）量化至8位(FP8)，顯著降低了計算需求，使單個服務器節點也能運行該模型。

此外，Meta利用405B模型提升了70B和8B模型的訓練後質量。在訓練後階段，團隊通過多輪對齊過程完善了聊天模型，包括監督式微調（SFT）、拒絕採樣和直接偏好優化。值得注意的是，大部分SFT樣本都是使用合成數據生成的。

Llama3還整合了圖像、視頻和語音功能，採用組合方法使模型能夠識別圖像和視頻，並支持語音交互。不過，這些功能仍在開發中，尚未正式發佈。

Meta還更新了許可協議，允許開發者使用Llama模型的輸出來改進其他模型。

Meta的研究人員表示:"能與業內頂尖人才一起在AI前沿工作，並公開透明地發佈研究成果，是無比令人振奮的。我們期待看到開源模型帶來的創新，以及未來Llama系列模型的潛力!"

這一開源舉措無疑將爲AI領域帶來新的機遇和挑戰，推動大語言模型技術的進一步發展。

快手：添加AIGC內容“作者聲明”不會影響作品流量

快手推出AI生成內容"作者聲明"功能，旨在減少誤解。此功能鼓勵在使用AI自動生成文本、圖片、視頻等創作前，創作者添加內聲明。即日起，發佈內容時依據手冊操作。聲明在內容發行中註明AI生成內容，解決創作者疑慮：添加聲明不影響作品流量，但需遵循國家法律與平臺規則。如更新快手APP至最新版本仍無法操作，可尋求幫助。該功能旨在與創作者共同利用AI技術，明確內容來源，共建多元化、真實、有趣的社區環境。

百川智能聯合天津大學推出“Sibyl System”Agent框架登頂大模型複雜任務榜單GAIA

百川智能與天津大學合作推出了"Sibyl System"智能體框架，並在GAIA Leader Board上取得了第一名的成績。GAIA是Meta、Huggingface和AutoGPT於2023年11月提出的全新評測方案，主要評測Agent在複雜任務執行方面的能力和方案。這個評測方案揭示了現有模型的能力缺陷，併爲模型和Agent的研發提供了改進方向。

人腦直連機器：天津大學等實現「缸中大腦」控制機器人，腦機接口技術邁入新時代！

天津大學腦機交互研究團隊成功研發全球首個人造腦組織複合信息交互系統“MetaBOC”，將人體腦細胞培養形成具有智能功能的類腦組織，並連接至微電子芯片，實現對機器人的精確操控與動態響應。這一突破性技術融合了腦機接口、混合智能與類腦計算，不僅爲腦機交互開闢了新篇章，還將對人工智能領域產生深遠影響。研究採用幹細胞技術實現了腦細胞的三維培養，提高神經網絡的複雜性，同時引入人工智能算法推動混合智能的研究。然而，隨之而來的倫理問題與維護人工智慧體的技術難題成爲關注的焦點，促使不斷深化對生命科學與人工智能倫理的探討。該研究展示出技術進步對於理解腦科學與推進科技創新的重要性，並提醒在未來智能化浪潮中重視技術倫理與可持續發展。

知網AI智能備課系統正式上線支持智能寫作、智能編改等

知網推出AI智能備課系統，運用AI技術和華知大模型，提供智能寫作、編改、推薦和管理功能，旨在提高教學質量。此係統能讓教師一鍵生成高質量教學方案，通過在線迭代完善教案設計，推薦與教案主題關聯的學術文獻，並支持教案內容的分類與導出管理，能顯著提升備課效率並減輕教師工作壓力。主要特點包括：增強的教學方案生成能力、高效滿意的教案修改過程、精準的學術資源推薦和方便的文檔管理，該系統能夠對教學大綱給予智能化的支持。感興趣的用戶可以通過提供的鏈接進行體驗和使用。

Sakana AI 推出新模型，重現日本傳統浮世繪藝術

東京初創公司Sakana AI推出了Evo-Ukiyoe和Evo-Nishikie兩個AI模型，旨在生成浮世繪風格藝術作品。Evo-Ukiyoe通過文字提示生成圖像，Evo-Nishikie則用於爲圖像添加浮世繪色彩或改變風格。這些模型分別基於自家的Evo-SDXL-JP模型優化而成，使用了24000多幅浮世繪藝術品作爲訓練數據。目前，這兩個模型僅支持日語提示，旨在提高對傳統日本美學的欣賞和教育，提供研究與開發工具，但尚不適用於商業用途。