黄学东在 GAIR 2023 大会上指出,大模型时代需要注重模型的集成与融通能力,以应对百花齐放的局面。他强调人们常常高估技术的短期效力,低估其长期影响。未来的发展趋势是以大模型为中心,实现多模态的联合发展。
相关推荐
Claude 旗舰模型 Fable 5 开启“按需付费”模式,订阅用户权益受限
Anthropic宣布7月7日起将旗下最强模型Claude Fable5从各档订阅中移除,转为按使用量积分计费。此前Pro、Max等用户每周可使用该模型的额度最高占50%,现将失效,这一调整引发用户争议。
2026年7月3号 14:26
187.2k
告别“代码重构”焦虑:阿里开源 Page Agent,让大模型读懂网页底层逻辑
阿里巴巴开源 Page Agent,改变浏览器自动化思路。它让大模型直接解析网页结构,而非依赖外部截图或协议驱动,从而动态适应变化,破解“造轮子”困境。
2026年7月3号 10:45
208.0k
美团大模型生态调整:全面限用豆包,力推自研 LongCat 体系
美团内部限制字节旗下“豆包”大模型使用,要求业务团队自查调用情况,如需保留须提交必要性说明及迁移规划。此举显示美团正加速向自研AI方案倾斜,调整基础设施选择。
2026年7月2号 13:55
230.4k
国产大模型再迎“重磅炸弹”:Kimi K3 或于本月发布,参数规模直指 2.5 万亿
大模型竞赛进入白热化,月之暗面确认Kimi K3将于本月发布。据透露,其参数规模高达2.5万亿,大幅超越DeepSeek V4 Pro的1万亿,性能跃升显著。
2026年7月2号 9:20
357.9k
性能提升超两倍:英伟达发布 Nemotron-Labs-TwoTower 扩散语言模型
英伟达开源Nemotron-Labs-TwinTower扩散语言模型,通过“双塔”架构突破自回归模型的串行解码瓶颈。该模型将生成任务拆分为两个子网络,其中一个保持冻结,以并行方式提升文本生成吞吐量,为大规模合成任务提供高效新解法。
2026年7月1号 17:22
238.9k
