相关推荐
百度发布Ernie5.1:预训练成本骤降94%,性能挺进全球Search排行榜前四
百度于2026年5月11日发布新一代语言模型Ernie5.1,基于2.4万亿参数的Ernie5.0预训练底座提取。通过“一次性弹性训练框架”,实现单一训练优化多尺寸模型,预训练成本仅为同类模型的6%。截至5月9日,该模型在Arena Search排行榜以1223分位列全球第四、中国第一,展现高资源利用率与性能平衡。
2026年5月12号 9:32
221.0k
日本政府推进 AI 与半导体行业人才培养计划
日本政府宣布成立跨部门工作组,重点为人工智能、半导体、量子技术、造船及国防制造等战略性行业培训人才。此举旨在将劳动力转向高增长领域,而非仅扩展传统职业培训。据《读卖新闻》报道,东京正协调设立“再技能与人才发展促进委员会”,隶属内阁办公室,以推动劳动力战略调整。
2026年5月11号 9:07
151.8k
阿里通义千问Qwen3-Max 在官网上线深度思考功能
阿里通义千问推出Qwen3-Max模型,新增“深度思考”模式,通过强化推理链分析和多步骤问题拆解,显著提升复杂任务处理效率。该模型参数量超1万亿,预训练数据达36T tokens,是目前规模最大、能力最强的版本,在代码和智能体能力方面均有明显进步。
2025年11月3号 9:06
236.0k
苹果推出全新 FS-DFM 模型,AI 长文本写作效率提升128倍!
苹果与俄亥俄州立大学联合推出FS-DFM模型,仅需8轮迭代即可生成媲美传统模型上千轮迭代的长文本,写入速度提升高达128倍,突破长文本生成效率瓶颈。该模型采用离散流匹配技术,区别于ChatGPT等逐字生成的自回归模型。
2025年10月14号 14:13
191.0k
蚂蚁发布万亿参数语言模型 Ling-1T,推理速度与能力引领行业新标杆
蚂蚁集团发布首款万亿参数开源模型Ling-1T,在推理、代码生成、数学计算等领域表现卓越,树立国产AI新标杆。该模型以超强推理速度与能力实现技术突破,测试中超越多款知名开源模型。
2025年10月9号 15:10
173.4k
