OSI發佈開源AI新標準：需披露訓練數據，Meta Llama是僞開源？

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 16, 2025

最近，開放源代碼倡議組織（OSI）發佈了一項新定義，明確什麼纔算是真正的 “開源” 人工智能。這一新標準引起了科技巨頭們的關注，尤其是 Meta 的 Llama 模型，因爲它並不符合這些規則。OSI 一直是開放源代碼軟件的行業標準制定者，但在 AI 系統中，有一些傳統許可證未能覆蓋的元素，比如模型訓練數據。

根據 OSI 的新定義，任何被認爲是真正開放源代碼的 AI 系統必須提供三樣東西:首先是有關訓練 AI 所用數據的詳細信息，以便他人能夠理解並重現這些結果;其次是用於構建和運行 AI 的完整代碼;最後，還需要提供訓練中的設置和權重，這些對 AI 的結果產生影響。

大模型代碼互聯網

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

這一規定直接挑戰了 Meta 的 Llama 模型。儘管 Llama 可以公開下載和使用，但它在商業用途上有一定的限制，並且沒有提供訓練數據，因此未能滿足 OSI 對於開放的標準。Meta 的發言人 Faith Eischen 表示，他們與 OSI 在許多方面是有共識的，但對於這個定義存在不同意見。她指出，定義 “開放源代碼 AI” 並不容易，因爲傳統的定義未能涵蓋當今快速發展的 AI 模型的複雜性。

OSI 的執行董事 Stefano Maffulli 表示，他們花了兩年的時間，與全球的專家共同制定這一標準。他們與學術界、機器學習和自然語言處理領域的專家進行了深入交流，也與內容創作者合作，力求做到全面。

Meta 限制訓練數據訪問的理由主要是出於安全考慮，但批評者則認爲其背後可能是爲了降低法律責任和保護競爭優勢。許多 AI 模型的訓練數據中幾乎肯定包含了版權材料。現在，針對 Meta、OpenAI 等公司的訴訟層出不窮，原告們只能依靠間接證據來證明他們的作品被抓取。

同時，Maffulli 認爲當前的情況與過去相似。他回憶起1990年代微軟對待開源的態度，認爲 Meta 正在以相似的理由將其技術封鎖。對他們而言，訓練數據就是 “祕密武器”。

劃重點:
🌐 OSI 發佈的新定義要求 AI 系統提供訓練數據、代碼和設置，推動 “開放 AI” 標準化。
🦙 Meta 的 Llama 模型因未能提供訓練數據而被認爲不符合開放源代碼標準，面臨行業質疑。
⚖️ 法律糾紛加劇，Meta 及其他 AI 公司因使用版權材料而受到多方訴訟，法律責任引發關注。

英國男子利用 AI 製造兒童性虐待影像被判 18 年

最近，一起引人注目的案件在英國引發了廣泛關注。一名27歲的男子休・尼爾森（Hugh Nelson）因利用人工智能將兒童的普通照片轉換成性虐待影像而被判處18年監禁。圖源備註:圖片由AI生成，圖片授權服務商Midjourney尼爾森來自博爾頓，他使用了一款名爲 Daz3D 的應用程序，創建了3D “角色”，這些角色都是基於無辜兒童的照片。令人震驚的是，尼爾森並不是獨自行動，他還收到了來自他人委託的圖像。有些人甚至將自己與兒童的照片提供給他，要求他製作這些圖像。據《衛報》報道，尼爾森

蘋果iOS 18.2 確認於12月推送將爲Siri植入ChatGPT

蘋果公司宣佈，即將於今年12月推出的iOS18.2、iPadOS18.2和macOS Sequoia15.2系統更新將帶來革命性的AI功能升級。其中最引人注目的是Siri將首次接入ChatGPT，標誌着蘋果在AI領域邁出了關鍵一步。此次升級後，蘋果用戶無需額外註冊賬戶即可免費使用ChatGPT的強大功能。系統將在保護用戶隱私的前提下，通過Siri調用ChatGPT的專業能力來回答用戶問題。值得一提的是，每次查詢前系統都會徵求用戶同意，確保用戶對數據共享有充分知情權。在創作功能方面，ChatGPT將被整合到系統寫作工具中。用戶可以利

到2030年，生成式AI或將產生相當於超10億部iPhone電子廢棄物

近日，劍橋大學和中國科學院的研究人員在《自然》雜誌上發表了一篇引人關注的論文，預測到2030年，隨着生成式人工智能的迅速發展，行業可能會每年產生相當於超過10億部 iPhone 的電子廢物。研究者們表示，他們的目的是爲了提前瞭解這一快速擴張技術的實際後果，而不是限制其使用。圖源備註:圖片由AI生成，圖片授權服務商Midjourney在論文中，研究團隊提到，雖然能源消耗早已成爲關注的焦點，但與這一過程相關的物理材料和淘汰電子設備的廢棄物流卻沒有受到足夠重視。他們的研究

xAI爲Grok添加圖像理解功能還能看懂梗圖的幽默

馬斯克旗下xAI公司近日爲其AI模型Grok增添了圖像理解功能，X平臺付費用戶現可向AI助手上傳圖片並進行相關提問。這項更新已經由xAI員工和Grok官方發言人在X平臺正式確認。馬斯克在平臺上展示了Grok的新能力，稱其不僅能理解圖片內容，還能解讀圖片中蘊含的幽默元素。不過他也坦言，目前這項功能仍處於早期階段，團隊將持續改進完善。值得注意的是，自今年8月面向高級用戶推出Grok-2模型以來，xAI一直在積極擴展其功能範疇。通過與黑森林實驗室（Black Forest Labs）的FLUX.1模型合作，Grok已

智源推出全能視覺生成模型 OmniGen 集多項能力於一體

北京智源人工智能研究院（BAAI）近日宣佈推出了一款全新的全能視覺生成模型OmniGen，標誌着圖像生成領域的一項重大突破。OmniGen模型以其統一性、簡單性和跨任務知識遷移能力而著稱，能夠在單一框架內處理多種圖像生成任務，包括文生圖、圖像編輯、主題驅動生成和視覺條件生成等。此外，OmniGen還能夠處理一些經典的計算機視覺任務，如圖像去噪和邊緣檢測，通過將這些任務轉換爲圖像生成任務來實現。

周鴻禕：AI不該成爲"超級神明"，而應是人類的"茶葉蛋"

360董事長周鴻禕在新浪新聞探索大會上分享了他對人工智能發展的獨特見解。作爲一位"堅定的AI鼓吹者"，他認爲AI技術的突破性發展堪比工業革命、電氣革命和信息革命，但同時對業界追求"超級智能"的方向提出了不同看法。針對OpenAI CEO Sam Altman近期發表的《智能時代》一文中對超級AI的展望，周鴻禕表達了自己的擔憂。他不認同將AI打造成一個"宇宙超級無敵、萬能"的存在，並以IBM早期對計算機市場的誤判爲例，說明技術革命往往源於普及化而非高度集中化的發展路徑。圖源備註：圖片由

OSI發佈開源AI新標準：需披露訓練數據，Meta Llama是僞開源？

相關AI新聞推薦

​英國男子利用 AI 製造兒童性虐待影像被判 18 年