正文

AI 大模型訓練背後，一條數據產業鏈正在形成

發布於AI新閒資訊

時間 :Aug 9, 2023

閱讀 :1分鐘

AI 大模型訓練背後，一條數據產業鏈正在形成。大模型訓練需要海量高質量數據，數據被看作未來大模型公司的核心競爭力之一。然而，數據的核算和交易面臨着許多挑戰，如確權、安全性管理等。

拒絕被 AI“白嫖”!維基百科25週年簽下微軟、Meta 付費大單

面對AI對流量和數據的衝擊，維基媒體基金會正加速商業化佈局，推出“維基媒體企業合作伙伴計劃”，吸引亞馬遜、Meta、微軟、Mistral AI和Perplexity等科技巨頭加入，探索AI時代的“知識訂閱”模式。

Jan 16, 2026

158.3k

摩爾線程重磅發佈 SimuMax 1.1 版本！分佈式訓練仿真工具全面升級

摩爾線程發佈SimuMax 1.1版本，從單一工具升級爲一體化全棧工作流平臺。新版本在保持高精度仿真能力基礎上，重點優化了用戶體驗，使大模型訓練仿真與調優更系統化、操作更友好。

Jan 9, 2026

178.8k

OpenAI 收購 Neptune,實驗監控神器入棧，GPT迭代速度或將翻倍

OpenAI收購實驗管理公司Neptune，將整合其監控調試工具至訓練技術棧，提升模型迭代的實時可見性。雙方將共同優化實驗追蹤與自動化警報功能。

Dec 4, 2025

161.1k

英偉達公開表示爲谷歌AI成就感到高興，但我們目前仍是行業領先

英偉達迴應谷歌AI進展，強調自身在AI基礎設施領域的核心地位，稱其是唯一能運行所有主流AI模型、覆蓋雲端到邊緣計算的全平臺，領先行業約一代。黃仁勳指出，英偉達通用GPU在性能、靈活性和可替代性上優於專用AI芯片。

Nov 26, 2025

202.2k

重磅發佈！中文互聯網基礎語料3.0助力AI發展，數據量高達120GB

9月18日，在昆明舉行的2025年國家網絡安全宣傳週人工智能安全治理分論壇上，中文互聯網基礎語料3.0正式發佈。這一新版本的數據量達到了驚人的120GB，旨在爲大模型訓練和人工智能的進一步發展提供可靠的數據支持。中文互聯網基礎語料3.0的發佈，是在中央網信辦的指導下，由中國網絡空間安全協會與國家互聯網應急中心等單位協同合作的成果。此次語料的開發與構建，得益於企業、高校和科研單位之間的緊密合作，充分利用了網安協會人工智能安全治理專委會建立的語料共建共享機制

Sep 18, 2025

183.5k

智啟未來，您的人工智能解決方案智庫