OpenAI和DeepMind在Scaling Laws研究中有不同观点和方法。Scaling Laws能预测大模型在参数量、数据量和计算量变动时的损失变化。他们的竞争将推动人工智能的发展,影响人机共存的未来。在大语言模型的预训练过程中,涉及模型大小、数据量、训练成本的权衡博弈。Scaling Laws可以帮助优化设计决策。DeepMind提出模型大小和数据量应按相等比例扩展,而OpenAI倾向于选择更大的模型。DeepMind开发了AlphaGo和AlphaFold,展示了深度强化学习和神经网络的潜力,而OpenAI则开发了GPT系列模型,在生成式模型上展示了非凡能力。研究结论表明影响模型性能的三个要素相互影响,DeepMind的Chinchilla模型表现优异。国内的百川智能和明德大模型也在Scaling Laws研究中有所贡献。DeepMind提出了Levels of AGI分类方法,揭示了人工智能不同发展阶段。
相关推荐
微软借OpenAI芯片技术“弯道超车”!自研AI芯片迈出关键一步,Satya Nadella亲曝合作细节
微软CEO纳德拉透露,公司已深度接入OpenAI的AI芯片研发成果,将加速自研AI芯片项目。此举旨在减少对英伟达的依赖,构建全栈AI基础设施,体现“先落地再超越”的务实创新策略。
2025年11月13号 9:35
95.5k
百度发布ERNIE-4.5-VL-28B-A3B-Thinking:精确定位图像细节解决复杂问题
百度推出多模态AI模型ERNIE-4.5-VL-28B-A3B-Thinking,能深度融合图像进行推理。该模型在多项基准测试中表现优异,有时超越谷歌Gemini2.5Pro和OpenAI GPT-5High等顶尖商业模型。虽总参数量280亿,但采用路由架构,仅激活30亿参数,实现轻量高效推理。
2025年11月13号 9:11
117.1k
GPT-5.1正式发布!不光更聪明,还会“共情”:新增6种人格风格,AI首次纳入情感依赖安全评估
OpenAI发布GPT-5.1,标志AI竞赛进入"情商融合"新阶段。模型重点强化情绪价值、个性化交互与人性化表达,解决用户反馈的"AI冰冷"问题。采用双模型架构:Instant模式快速响应,Thinking模式深度思考。全球分批推送中,付费用户3个月内可继续使用GPT-5过渡。
2025年11月13号 8:59
157.3k
OpenAI 拒绝《纽约时报》请求交出用户聊天记录,强调隐私保护
《纽约时报》要求OpenAI交出2000万条ChatGPT用户私人聊天记录,OpenAI已请求法院驳回,称此举无视安全与隐私原则,可能泄露大量无关私密信息,并质疑其动机在于探查用户数据。
2025年11月13号 8:56
110.4k
鸿海与 OpenAI 联手,下周正式公布合作详情
鸿海科技集团宣布下周公布与OpenAI合作细节。双方将结合鸿海的硬件制造优势与OpenAI的AI技术专长,预计聚焦AI硬件开发、人工智能模型整合及智能制造等前沿领域。此次合作可能对科技产业格局产生重要影响。
2025年11月12号 16:10
364.4k
