相关推荐
苹果公司计划通过设备数据提升人工智能技术
苹果公司(Apple Inc.)最近宣布,将开始分析用户设备上的数据,以增强其人工智能平台。这一举措旨在在保障用户信息安全的同时,帮助苹果在与竞争对手的人工智能技术较量中缩小差距。 目前,苹果主要使用合成数据来训练其人工智能模型。这种合成数据旨在模拟真实世界的输入,但不包含任何个人信息。然而,这种合成数据并不总能准确反映实际用户的数据,这使得苹果的人工智能系统在运作时面临挑战。 为了改善这一现状,苹果决定直接从用户的设备中获取数据。通过分析实际
谷歌研究揭示:合成数据提升大模型逻辑推理能力八倍
在最新的研究中,谷歌与卡内基梅隆大学及 MultiOn 团队联手,探讨了合成数据对大型模型的训练效果。他们发现,合成数据能够显著提升大模型在逻辑推理方面的表现,尤其是在数学问题的解决能力上,提升幅度达到了惊人的八倍。这一发现对于当前训练数据日益匮乏的现状具有重要的意义。目前,全球可用的高质量文本训练数据约为300万亿条,但随着像 ChatGPT 这样的模型日益普及,对训练数据的需求急剧增加,预计到2026年,这些数据将难以满足需求。在此背景下,合成数据成为了一种极
谷歌新研究:合成数据助力大模型,数学推理能力提升八倍
近期,谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告,目前人类公开的高质量文本训练数据大约有300万亿 tokens,但随着大型模型如 ChatGPT 的快速发展,对训练数据的需求正以指数级增长,预计在2026年前这些数据将被消耗殆尽,因此合成数据逐渐成为重要的替代方案。研究人员探索了合成数据的两种主要类型:正面数据和负面数据。正面数据是指来自高性能大模型(如 GPT-4和 Gemini1.5Pro)生成的正确
杭州六小龙开源新模型SpatialLM,助力机器人瞬间理解 3D 世界!
最近,杭州的科技公司群核科技再次引起了行业关注,因其开源的空间理解模型 SpatialLM 被谷歌在一篇论文中点名感谢。这个模型的创新之处在于,它能让机器人通过一段普通的视频理解物理世界的几何关系,标志着机器人训练领域的一次重大突破。SpatialLM 的核心功能是将手机拍摄的视频转化为三维空间布局信息。用户只需用手机录制家中的布局,SpatialLM 便能生成一个详细的3D 场景,包括房间的结构、家具的位置和通道的宽度。这一过程大大降低了机器人训练的成本,提高了训练的效率。
英伟达重磅出手!收购合成数据初创公司Gretel,加速布局生成式AI
人工智能芯片巨头英伟达(Nvidia)传出重大收购消息,其已收购位于圣地亚哥的初创公司Gretel。Gretel 专注于开发用于生成合成人工智能训练数据的平台。据 Wired 报道,此次收购的价格达到了九位数美元,超过了 Gretel 最近一次3.2亿美元的估值,但具体的交易条款尚未公开。Gretel 成立于2019年,由 Alex Watson、Laszlo Bock、John Myers 和 Ali Golshan 联合创立,其中 Ali Golshan 担任公司首席执行官。这家初创公司通过微调模型、添加专有技术,并将这些模型打包出售。在被英伟达收购之前,Gretel 已经从包
