相關推薦
蘋果公司計劃通過設備數據提升人工智能技術
蘋果公司(Apple Inc.)最近宣佈,將開始分析用戶設備上的數據,以增強其人工智能平臺。這一舉措旨在在保障用戶信息安全的同時,幫助蘋果在與競爭對手的人工智能技術較量中縮小差距。 目前,蘋果主要使用合成數據來訓練其人工智能模型。這種合成數據旨在模擬真實世界的輸入,但不包含任何個人信息。然而,這種合成數據並不總能準確反映實際用戶的數據,這使得蘋果的人工智能系統在運作時面臨挑戰。 爲了改善這一現狀,蘋果決定直接從用戶的設備中獲取數據。通過分析實際
谷歌研究揭示:合成數據提升大模型邏輯推理能力八倍
在最新的研究中,谷歌與卡內基梅隆大學及 MultiOn 團隊聯手,探討了合成數據對大型模型的訓練效果。他們發現,合成數據能夠顯著提升大模型在邏輯推理方面的表現,尤其是在數學問題的解決能力上,提升幅度達到了驚人的八倍。這一發現對於當前訓練數據日益匱乏的現狀具有重要的意義。目前,全球可用的高質量文本訓練數據約爲300萬億條,但隨着像 ChatGPT 這樣的模型日益普及,對訓練數據的需求急劇增加,預計到2026年,這些數據將難以滿足需求。在此背景下,合成數據成爲了一種極
谷歌新研究:合成數據助力大模型,數學推理能力提升八倍
近期,谷歌、卡內基梅隆大學與 MultiOn 的研究團隊聯合發佈了一項關於合成數據在大模型訓練中應用的新研究。根據 AI 發展科研機構 Epoch AI 的報告,目前人類公開的高質量文本訓練數據大約有300萬億 tokens,但隨着大型模型如 ChatGPT 的快速發展,對訓練數據的需求正以指數級增長,預計在2026年前這些數據將被消耗殆盡,因此合成數據逐漸成爲重要的替代方案。研究人員探索了合成數據的兩種主要類型:正面數據和負面數據。正面數據是指來自高性能大模型(如 GPT-4和 Gemini1.5Pro)生成的正確
英偉達重磅出手!收購合成數據初創公司Gretel,加速佈局生成式AI
人工智能芯片巨頭英偉達(Nvidia)傳出重大收購消息,其已收購位於聖地亞哥的初創公司Gretel。Gretel 專注於開發用於生成合成人工智能訓練數據的平臺。據 Wired 報道,此次收購的價格達到了九位數美元,超過了 Gretel 最近一次3.2億美元的估值,但具體的交易條款尚未公開。Gretel 成立於2019年,由 Alex Watson、Laszlo Bock、John Myers 和 Ali Golshan 聯合創立,其中 Ali Golshan 擔任公司首席執行官。這家初創公司通過微調模型、添加專有技術,並將這些模型打包出售。在被英偉達收購之前,Gretel 已經從包
馬斯克警告:現實可用於訓練 AI 的數據幾乎耗盡
在最近的一次直播對話中,特斯拉和 SpaceX 首席執行官埃隆・馬斯克表示,現實世界中可用於訓練人工智能模型的數據已經幾乎耗盡。與他進行對話的是 Stagwell 董事會主席馬克・佩恩。馬斯克提到,“我們現在基本上已經消耗掉了所有人類知識的積累…… 用於人工智能訓練的數據。這個現象基本上是去年發生的。”馬斯克的這一觀點與前 OpenAI 首席科學家伊利亞・蘇茨克弗在去年12月的 NeurIPS 會議上提出的 “數據峯值” 理論相似。蘇茨克弗表示,AI 行業正面臨數據短缺的挑戰,未來缺乏足
