最近,科技巨頭英偉達在數據獲取方面的一項祕密行動被曝光。根據媒體404的報道,英偉達通過抓取海量 YouTube 視頻數據來訓練他們的人工智能模型,這一行爲在法律和倫理上都相當模糊。

英偉達

報告中指出,英偉達正利用這些視頻數據訓練其多款 AI 模型,包括 Cosmos 深度學習模型、自動駕駛算法、數字人類 AI 頭像產品,以及3D 世界構建工具 Omniverse。

據瞭解,英偉達採取了許多隱蔽措施來掩蓋他們的數據抓取行爲,使用了多個 “虛擬機器” 並不斷更換 IP 地址,以避免被 YouTube 發現。而且,視頻創作者和 YouTube 的母公司谷歌並未對此次數據抓取活動給予任何授權。英偉達內部的溝通顯示,他們的策略相當大膽,一位高管在郵件中提到正在構建一個 “視頻數據工廠”,每天能夠產生相當於人類一生的視覺體驗數據。

有意思的是,當員工對這種數據獲取的合法性和倫理性表示擔憂時,管理層對此卻顯得相當自信,認爲這一切都是高層的決定。郵件中寫道:“我們對所有數據都有一個全面的批准。”

更令人感到不安的是,英偉達曾在一段時間內明知自己正在使用一個包含1.3億個 YouTube 視頻的 HD-VG-130M 數據集,而這個數據集本來是爲了學術研究而創建的。許多專家對此表示強烈不滿,認爲將用於研究的數據用於商業化是一種不當行爲。

作爲 AI 產業的核心參與者,英偉達在市場上佔據了顯著的地位,其圖形處理單元(GPU)是許多計算密集型 AI 系統的基礎。與英偉達合作的公司如 OpenAI、微軟和谷歌等都對此行爲表示關注。谷歌的發言人提到,未經許可使用 YouTube 數據是明顯違反平臺服務條款的。

英偉達在迴應媒體時聲稱,他們的 AI 訓練行爲是 “完全符合版權法的精神和字面意思”。然而,使用這些內容的創作者們對這一說法又會有怎樣的看法呢?

劃重點:

📹 英偉達祕密抓取大量 YouTube 視頻數據進行 AI 訓練,法律和倫理問題引發關注。  

💻 內部郵件顯示,英偉達高管認爲這一行爲獲得了全面批准,態度相當大膽。  

📜 谷歌指出,未經許可使用 YouTube 數據明顯違反平臺服務條款,英偉達的迴應引發爭議。