微软发布 Windows 11 23H2 更新,AI 助手 Copilot 上线

华人团队研究发现,扩散语言模型在Token受限时展现出比自回归模型高三倍的数据学习能力。研究采用10亿参数模型,经480周期训练后,在HellaSwag和MMLU测试中分别达到56%和33%准确率。关键发现包括:1)扩散模型通过双向建模和更高计算密度实现更优性能;2)模型对数据重复使用具有鲁棒性,过拟合时性能仍可能提升。该研究为Token受限场景下的模型训练提供了新思路,团队计划用更大模型进一步验证。
腾讯2025年Q2财报显示,营收1845亿元(同比+15%),研发投入202.5亿元(+17%),AI领域成果显著。资本开支191.1亿元(+119%)主要用于AI技术研发,包括数据增强和模型优化。"混元家族"3D模型系列表现亮眼,v2.5版本和美术级3D生成大模型发布,开源版本吸引23万+下载。AI应用加速落地,微信/QQ新增视频号解读等智能功能,持续提升用户体验。财报反映出腾讯在AI和3D技术领域的领先优势及商业化潜力。
腾讯二季度研发投入202.5亿元,AI战略成效显著:营收1845亿元(+15%),经营利润692.5亿元(+18%)。混元AI模型能力持续提升,3D系列模型取得多项突破,下载量超230万,广泛应用于游戏、3D打印等领域。AI应用加速落地,元宝升级核心功能并融入微信生态,推动AI服务向多场景渗透。
Rokid在香港推出支持广东话的智能眼镜海外版,集成多款AI模型实现翻译、识别等功能,10月将上线实时导航。搭载高通AR芯片,通过CSL Mobile独家预售,赠价值910港元礼包。
开源AI模型Jan-v1发布,基于阿里云Qwen3-4B-Thinking微调,仅4亿参数却实现91%的SimpleQA准确率,超越商业产品Perplexity Pro。支持256K上下文并可通过YaRN扩展至100万tokens,完全本地运行仅需4GB VRAM,保障隐私安全。创新双模推理机制,透明化推理过程适合学术研究。采用Apache2.0开源协议,支持多种部署方式,在开发者社区引发热议,重新定义小型模型潜力。
腾讯科技报道称,DeepSeek否认了下一代大模型DeepSeek-R2将于8月发布的消息。此前已有多次关于该模型发布的传言,但均被官方否认。据悉,由于CEO梁文锋对模型性能不满意,团队仍在优化提升。原定5月发布的计划已推迟,新模型预计将增强代码生成质量和非英语推理能力。目前官方尚未公布具体发布时间和技术细节。