相关推荐
苹果公司计划通过设备数据提升人工智能技术
苹果公司(Apple Inc.)最近宣布,将开始分析用户设备上的数据,以增强其人工智能平台。这一举措旨在在保障用户信息安全的同时,帮助苹果在与竞争对手的人工智能技术较量中缩小差距。 目前,苹果主要使用合成数据来训练其人工智能模型。这种合成数据旨在模拟真实世界的输入,但不包含任何个人信息。然而,这种合成数据并不总能准确反映实际用户的数据,这使得苹果的人工智能系统在运作时面临挑战。 为了改善这一现状,苹果决定直接从用户的设备中获取数据。通过分析实际
谷歌研究揭示:合成数据提升大模型逻辑推理能力八倍
在最新的研究中,谷歌与卡内基梅隆大学及 MultiOn 团队联手,探讨了合成数据对大型模型的训练效果。他们发现,合成数据能够显著提升大模型在逻辑推理方面的表现,尤其是在数学问题的解决能力上,提升幅度达到了惊人的八倍。这一发现对于当前训练数据日益匮乏的现状具有重要的意义。目前,全球可用的高质量文本训练数据约为300万亿条,但随着像 ChatGPT 这样的模型日益普及,对训练数据的需求急剧增加,预计到2026年,这些数据将难以满足需求。在此背景下,合成数据成为了一种极
谷歌新研究:合成数据助力大模型,数学推理能力提升八倍
近期,谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告,目前人类公开的高质量文本训练数据大约有300万亿 tokens,但随着大型模型如 ChatGPT 的快速发展,对训练数据的需求正以指数级增长,预计在2026年前这些数据将被消耗殆尽,因此合成数据逐渐成为重要的替代方案。研究人员探索了合成数据的两种主要类型:正面数据和负面数据。正面数据是指来自高性能大模型(如 GPT-4和 Gemini1.5Pro)生成的正确
英伟达重磅出手!收购合成数据初创公司Gretel,加速布局生成式AI
人工智能芯片巨头英伟达(Nvidia)传出重大收购消息,其已收购位于圣地亚哥的初创公司Gretel。Gretel 专注于开发用于生成合成人工智能训练数据的平台。据 Wired 报道,此次收购的价格达到了九位数美元,超过了 Gretel 最近一次3.2亿美元的估值,但具体的交易条款尚未公开。Gretel 成立于2019年,由 Alex Watson、Laszlo Bock、John Myers 和 Ali Golshan 联合创立,其中 Ali Golshan 担任公司首席执行官。这家初创公司通过微调模型、添加专有技术,并将这些模型打包出售。在被英伟达收购之前,Gretel 已经从包
马斯克警告:现实可用于训练 AI 的数据几乎耗尽
在最近的一次直播对话中,特斯拉和 SpaceX 首席执行官埃隆・马斯克表示,现实世界中可用于训练人工智能模型的数据已经几乎耗尽。与他进行对话的是 Stagwell 董事会主席马克・佩恩。马斯克提到,“我们现在基本上已经消耗掉了所有人类知识的积累…… 用于人工智能训练的数据。这个现象基本上是去年发生的。”马斯克的这一观点与前 OpenAI 首席科学家伊利亚・苏茨克弗在去年12月的 NeurIPS 会议上提出的 “数据峰值” 理论相似。苏茨克弗表示,AI 行业正面临数据短缺的挑战,未来缺乏足
