蘋果、英偉達等科技公司被曝未經許可使用YouTube視頻訓練AI

據《連線》雜誌報道，包括蘋果、英偉達、Anthropic和Salesforce在內的多家科技巨頭被發現未經許可使用數千個YouTube視頻來訓練他們的人工智能模型，引發了嚴重的版權和倫理爭議。

報道披露，這些公司將各種YouTube視頻的字幕整合入其AI訓練數據集中。受影響的創作者範圍廣泛，包括知名博主MKBHD、MrBeast、Jacksepticeye，脫口秀演員斯蒂芬・科爾伯特、約翰・奧利弗和吉米・坎摩爾，以及麻省理工學院、可汗學院、哈佛大學等教育頻道，還有華爾街日報、NPR等主流媒體。

機器人人工智能人臉識別 AI

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

這些數據實際上是由一個名爲Eleuther AI的非營利組織下載並整理的。該組織將這些內容作爲他們發佈的「The Pile」大數據集的一部分，原本意在爲小型開發者和學者提供訓練材料。然而，這些數據集隨後被各大科技公司所利用。

值得注意的是，蘋果等公司並未直接從YouTube下載這些數據，而是使用了Eleuther AI整理的數據集。從技術層面來說，直接違反YouTube使用條款的是Eleuther AI，而非這些科技公司。

這一事件引發了關於AI訓練數據來源的合法性和倫理性的討論。它突顯了在快速發展的AI領域中，數據版權和使用許可的重要性，以及現有法律法規在面對這些新興技術挑戰時的不足。同時，這也爲創作者、平臺和AI公司之間的權益平衡帶來了新的思考。

Qwen2-Audio：千問系列的音頻多模態模型無需文字即可語音交互

阿里雲推出“Qwen-Audio”，一款大型音頻語言模型，革新語音交互體驗。型號能接收多種音頻輸入，執行音頻分析並直接響應語音指令。用戶提供獨特的音交互模式，無需文字輸入，直接通過語音交流，並在音頻中提供聲音和文本分析。具備智能理解能力，能夠結合多音源指令並解析，如區分單一聲音、多聲道對話及命令，並協助音頻解釋和響應。性能超越先前優秀模型，特別是在基於音頻的指令跟蹤功能與聊天模式上。具備開源特性，促進多模態語言發展。產品將分爲Qwen2-Audio和Qwen-Audio-Chat，進一步優化多種音頻操作體驗。在無需特定任務調整的前提下，模型展示了卓越性能。特別在英文自動語音識別（ASR）與聊天任務上表現出色。強調跨聲音、音樂和混合音頻集的強大指令跟蹤功能，顯著優於其他大型語言模型（LALM）與Qwen-Audio。

Wild Gaussians：用AI 技術可根據用戶拍攝的網絡照片進行 3D 重建

捷克布拉格技術大學和瑞士蘇黎世聯邦理工學院的研究團隊最近推出了一種名爲"WildGaussians"的創新方法，該方法顯著提升了3D高斯濺射（3DGS）技術在處理非結構化圖像集時的能力。這一突破性進展使得從網絡上收集的地標照片等非結構化圖像集實現高質量3D重建成爲可能。

智源研究院推出新一代無編碼器視覺語言多模態大模型EVE

近期，多模態大模型的研究和應用取得了顯著進展。國外公司如OpenAI、Google、Microsoft等推出了一系列先進的模型，國內也有智譜AI、階躍星辰等機構在該領域取得了突破。這些模型通常依賴視覺編碼器來提取視覺特徵並與大語言模型結合，但存在訓練分離導致的視覺歸納偏置問題，限制了多模態大模型的部署效率和性能。

小冰AI數字員工升級：發佈全新“零樣本”技術、超千億大模型基座

小冰公司的最新發布標誌着其AI數字員工產品的重大升級，新增“零樣本”數字人技術（Zero-shot Xiaoice Neural Rendering，Zero-XNR）、超千億大模型基座以及高能多媒體傳輸系統，顯著提升實時交互質量和效果。Zero-XNR技術結合TTS語音模型，並配以高效聚類框架實現秒級高質量聲音與形象復刻。大模型基座與Agent構建框架的強化集結了強大的職業交互功能，用於精準商業交互。透影音畫傳輸系統的引入，則確保了超高清視頻的傳輸流暢性與抗干擾性，增強了用戶體驗。在技術創新引領下，小冰旨在推動數字人技術的普及與產業化應用，經過微軟背景的專業打磨，現已成爲一家獨享核心技術的中國AI公司。其技術框架涵蓋了自然語言處理、語音識別、視覺交互及AI內容生成，已成功構建全球化的AI數字人產品體系，服務從金融到教育、智能汽車、智能地產等衆多行業，支持數字工作者提供平穩、可靠並生產力充足的交互體驗。

英國監管機構調查微軟與Inflection AI的人事變動是否構成“合併情況”

英國競爭與市場管理局（CMA）已展開調查，以評估微軟聘用來自AI公司Inflection AI前員工的情況是否構成反競爭行爲。Inflection AI的聯合創始人Mustafa Suleyman於2024年3月加入微軟並帶走了多名員工，這一行動引起了CMA的高度關注。調查旨在審查微軟與Inflection AI之間的相關協議，評估是否形成了“相關合並情況”，從而可能影響市場競爭。CMA在調查中不僅關注微軟單方的行動，還考慮了其他大型科技公司與AI初創企業的合作模式，目的是確保市場權力不通過AI合作而受到不當的集中。CMA決定是否繼續調查的時間點爲2024年9月11日，該決定將對市場格局產生重要影響。例證包括Inflection AI提供的生成式AI聊天機器人Pi，該軟件依託於在微軟Azure雲平臺上託管的大型語言模型Inflection2.5，進行着“溫暖且支持性的互動”。CMA此番關注點，部分或將落在AI行業的合作伙伴關係以及這些關係在基礎模型（FMs）價值鏈中的潛在影響力上。