正文

AI奥赛金牌战:OpenAI与谷歌DeepMind上演“气氛”对决，谁是真赢家?

发布于AI新闻资讯

发布时间 :2025年7月22号 8:54

阅读 :1分钟

近日，人工智能领域两大巨头OpenAI和谷歌DeepMind相继宣布，其AI模型在2025年国际数学奥林匹克竞赛（IMO）中荣获金牌。这一成就不仅彰显了人工智能系统惊人的发展速度，也意外点燃了两家公司之间一场关乎“领先地位”认知的激烈竞争。

IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一，其结果被视为衡量人工智能推理能力的重要基准。去年，谷歌以一个需要人工协助的“正式”系统在IMO中摘得银牌。而今年，OpenAI和谷歌都推出了更先进的**“非正式”系统**，这些系统能够直接从自然语言问题中提取信息，并生成有理有据的答案，无需人工转换。两家公司均声称，其AI模型在IMO考试中正确回答了六道题中的五道，超越了多数高中生和谷歌去年的AI模型表现。

机器人对决

推理模型突破与争议

在接受采访时，OpenAI和谷歌IMO项目的研究人员表示，这些金牌成绩代表了AI推理模型在不可验证领域的突破。这尤其重要，因为传统的AI推理模型擅长解决答案明确的问题（如简单数学或编程），但在解决方案模糊的任务上(如协助复杂研究)则表现欠佳。

然而，围绕此次金牌成绩的**“谁先宣布”和“如何宣布”**，两家公司爆发了激烈的争执。OpenAI在周六早上率先公布其AI模型获得金牌的消息，此举立即引来了谷歌DeepMind首席执行官和研究人员的批评。谷歌DeepMind高级研究员、IMO项目负责人Thang Luong向TechCrunch表示，谷歌选择等待官方结果公布是为了尊重参赛学生，并已与国际数学奥林匹克组织者合作准备考试，并于周一上午才公布了官方结果，该结果获得了IMO主席和官方评分的支持。Luong强调:“国际数学奥林匹克组织者有自己的评分标准。所以，任何不基于该标准的评估都不能声称其成绩达到了金牌水平。”

各执一词，竞争白热化

OpenAI参与IMO模型开发的Noam Brown则解释称，IMO数月前曾邀请OpenAI参加正式竞赛，但因当时专注于开发更具研究价值的自然语言系统而婉拒。Brown表示，OpenAI并不知晓IMO正与谷歌进行非正式测试。OpenAI方面称，他们聘请了三位熟悉评分系统的前IMO奖牌获得者作为第三方评估员，来评估其AI模型的表现。在得知金牌成绩后，OpenAI联系了IMO，但IMO建议其等到周五晚上的颁奖典礼结束后再公布结果。IMO方面尚未对TechCrunch的置评请求做出回应。

尽管谷歌在程序上或许更为严谨，但这场争论的背后，是全球领先AI实验室模型飞速进步的宏大图景。今年全球顶尖高中生齐聚IMO，但只有少数人的得分能与OpenAI和谷歌的AI模型匹敌。这表明，曾经遥遥领先的OpenAI，如今正面临着一场比以往任何时候都更加激烈的竞争。随着OpenAI预计在未来几个月发布GPT-5，维持其在AI领域的领先地位形象，无疑是当前“气氛”之战的关键所在。

高通AI重磅发布CSD-VAR：视觉自回归模型内容-风格分解新突破，解锁创意生成新高度！

高通AI研究院推出创新技术CSD-VAR，通过内容-风格分解方法提升视觉自回归模型的生成能力。该技术采用尺度感知生成和SVD校正，实现内容与风格的精准分离，在保真度和风格化效果上优于传统扩散模型。配套发布的CSD-100数据集优化了模型训练评估。CSD-VAR还引入K-V内存机制提升处理效率，在艺术创作、游戏开发等领域应用前景广阔，展现了高通在视觉生成技术上的领先地位。

2025年7月22号 10:55

139.6k

Trae 2.0 正式升级 SOLO 模式：智能自主开发全流程集成一步到位

字节跳动推出Trae IDE 2.0版本，其革命性SOLO模式实现AI自主编程突破。该模式整合编辑器、终端等工具，能独立完成从构思到部署的全流程开发，无需持续人工干预。测试显示SOLO可自主开发并部署应用，如微信朋友圈分析工具。相比传统AI编码工具，Trae2.0提供更完整的端到端解决方案，超越同类竞品。目前Pro用户已可体验该功能，需邀请码解锁。此次升级标志着开发范式变革，为AI与人类协作开辟新路径。

2025年7月22号 10:30

251.0k

智谱AI重磅推出Zread：一键将GitHub项目转为清晰使用手册，开发者效率神器！

智谱AI推出Zread新功能，可将GitHub项目一键转化为结构化使用手册。该功能无需复杂配置，能自动生成内容详实、结构清晰的文档，包含目录导航和可视化图表，大幅提升开发者理解开源项目的效率。Zread适用于不同水平的开发者，从项目概览到深入使用都能提供帮助。这是智谱AI继开源GLM系列模型后，在开发者工具领域的又一创新，展现了AI优化开发流程的潜力。目前该功能可免费体验。

2025年7月22号 10:14

154.6k

经济学家警告：AI 泡沫或将比互联网泡沫更严重

经济学家警告当前AI泡沫风险超过90年代互联网泡沫。标准普尔500前十公司市盈率创历史新高，但盈利未同步增长，估值与基本面脱节。英伟达等科技巨头在AI领域投入巨资，但收益远未匹配支出。专家将当前AI热潮比作次贷危机，指出市场存在过热风险。尽管预测生成式AI市场将快速增长，但当前收入规模与巨额投资相比仍微不足道，投资者需警惕潜在的市场调整风险。

2025年7月22号 9:52

148.0k

Instacart 首席执行官 Fidji Simo 履新 OpenAI，掌舵“应用”部门

Instacart CEO Fidji Simo将于8月18日加入OpenAI担任新设立的"应用首席执行官"，直接向Sam Altman汇报，负责领导公司三分之一团队，将AI技术转化为实际应用。该职位是Altman5月重组计划的一部分，旨在让其专注研发，而Simo专注产品增长。她将整合现有业务团队，推动AI在医疗、教育、创意等领域的应用落地。Simo强调AI发展面临关键抉择：是普惠大众还是加剧权力集中。此次任命正值OpenAI管理层调整期，Simo此前已担任董事。

2025年7月22号 9:25

132.1k

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご