谷歌承認:即使網站選擇退出，仍用搜索數據訓練 AI

科技巨頭谷歌在近日的一場聯邦反壟斷審判中承認，即使網站出版商明確選擇不讓其內容用於人工智能模型訓練，谷歌仍會利用其搜索引擎收集的數據進行 AI 訓練，包括備受爭議的 AI Overviews 功能。

這一承認由谷歌旗下人工智能實驗室 DeepMind 的副總裁伊萊·柯林斯在作證時做出。司法部律師戴安娜·阿吉拉爾在質詢中指出，即使出版商選擇不讓 DeepMind 使用其數據進行大型語言模型訓練，這些相同的數據仍然會被谷歌搜索部門用於其自身的人工智能項目。

谷歌 (3)

阿吉拉爾援引一份2024年的內部文件顯示，谷歌已收集了高達1600億個文本單元用於人工智能訓練。儘管其中一半（800億個）據稱因出版商的選擇退出而被刪除，但柯林斯的證詞表明，這800億個文本單元仍在谷歌內部用於人工智能訓練，只是不再用於 DeepMind。

更令人擔憂的是，谷歌爲網站提供的唯一阻止其人工智能抓取內容的方法，竟然是徹底從谷歌搜索引擎的索引中移除。對於任何依賴網絡流量的網站而言，這幾乎等同於“死刑”，根本不構成真正的選擇。

谷歌方面暗示，這種做法僅僅是廣泛使用的“robots.txt”文件的工作方式所致。該文件用於指示網絡爬蟲可以訪問網站的哪些部分，而這些爬蟲既服務於搜索引擎的數據收集，也服務於當前的人工智能訓練。谷歌發言人在一份聲明中表示，公司通過完善的網絡標準 robots.txt，爲出版商提供了管理其在搜索中內容的方式。

值得注意的是，去年一名聯邦法官已裁定谷歌在搜索引擎市場存在非法壟斷，濫用其主導地位排擠競爭對手並擡高廣告價格。目前，監管機構正在考慮如何打破這一壟斷，可能的措施包括迫使谷歌出售 Chrome 瀏覽器、禁止其與其他公司簽訂默認搜索引擎協議，或強制其共享部分數據。

此次審判的新進展進一步凸顯了谷歌如何利用其在美國高達90% 的搜索引擎市場份額，通過其人工智能計劃實現自身目標。如果網站避免其內容被谷歌人工智能抓取的唯一途徑是放棄在谷歌搜索結果中的展示，從而切斷與絕大部分網絡用戶的聯繫，這無疑爲谷歌的壟斷行爲再添一項證據。教育網站 Chegg 近期也提出了類似的指控，聲稱谷歌利用其壟斷地位迫使其免費提供內容以訓練人工智能工具。

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

在圖像生成領域，Midjourney 近期推出了一項名爲 “Omni-Reference”（全向參考）的新功能，爲用戶帶來了更大的創作自由。這一全新圖像引用系統不僅是 V6版本中 “角色參考” 功能的升級版，更是賦予用戶在創作過程中對圖像元素的精準控制。核心功能:全向參考與多元素支持Omni-Reference通過先進的圖像參考系統，爲用戶提供了前所未有的創作控制力。AIbase梳理了其主要亮點: 精準元素指定:用戶可上傳參考圖像（如人物、動物、武器或車輛），通過提示明確要求“將此元素放入圖像”，生成

谷歌Gemini聊天機器人全新升級：支持多圖上傳和圖像編輯功能

近日，谷歌的 Gemini 聊天機器人迎來了重要更新，新增了多圖上傳功能，這一功能目前已經向部分用戶開放。以往，用戶只能上傳單張圖片，但現在在 Gemini2.0Flash 模型的支持下，部分用戶已經能夠在網頁端同時上傳多張圖片。值得注意的是，該功能尚不支持免費賬戶，且在某些付費高級賬戶中也沒有完全開放。這種分階段推出的策略可能是爲了逐步評估用戶的反饋。除了多圖上傳，谷歌還在更新中加入了 AI 圖像編輯功能，用戶現在可以對 AI 生成的圖像以及自己上傳的圖片進行更改。用戶

阿聯酋從幼兒園起普及人工智能課程，全球應效仿

阿聯酋近日宣佈了一項全國性計劃，將人工智能（AI）作爲所有學生從幼兒園到高中必修的課程。該政策將在2025-2026學年正式實施，屆時所有公立學校都將把 AI 課程納入核心教學體系。阿聯酋官員表示，私人學校也可能會在國家指導下跟進這一政策，旨在爲年輕一代做好迎接科技驅動未來的準備，增強他們的 AI 技能，鞏固阿聯酋在區域內的 AI 和數字創新領導地位。圖源備註：圖片由AI生成，圖片授權服務商Midjourney新課程結構經過精心設計，按年齡層逐步引入七個關鍵學習領域，包括基礎

英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升

近日，英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別（ASR）模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升，還將開源理念與商業應用相結合，吸引了廣泛關注。超強轉錄能力Parakeet-TDT-0.6B-V2的最大亮點在於其出色的轉錄效率。據稱，該模型能夠在僅僅一秒內完成60分鐘音頻的轉錄，極大提高了語音處理的速度。這一效率讓開發者和企業在構建語音識別和轉錄服務時，能夠獲得更快的反饋和更高的生產力。在技術參數上，Parakeet-TDT-0.6B-V2擁有6億個參數，結合了 Fas

谷歌承認:即使網站選擇退出，仍用搜索數據訓練 AI

相關推薦

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

Grok語音模式全面上線馬斯克更改X暱稱造勢

谷歌Gemini聊天機器人全新升級：支持多圖上傳和圖像編輯功能

阿聯酋從幼兒園起普及人工智能課程，全球應效仿

英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升

谷歌承認:即使網站選擇退出，仍用搜索數據訓練 AI

相關推薦

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

Grok語音模式全面上線 馬斯克更改X暱稱造勢

谷歌Gemini聊天機器人全新升級：支持多圖上傳和圖像編輯功能

​阿聯酋從幼兒園起普及人工智能課程，全球應效仿

​英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升

Grok語音模式全面上線馬斯克更改X暱稱造勢

阿聯酋從幼兒園起普及人工智能課程，全球應效仿

英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升