国家自然资源部近日宣布,国家海洋环境预报中心联合海洋出版社有限公司和三六零数字安全科技集团有限公司成功开发并发布了海洋垂直领域大语言模型——"瀚海智语"(英文名称OceanDS)。
该模型以360智脑13B和Deepseek-R1-70B大模型为基座,专注于海洋领域应用,已顺利通过专家评审并正式发布。"瀚海智语"的问世标志着中国在海洋领域人工智能技术应用方面迈出了重要一步,将为海洋行业的智慧化转型提供强有力的技术支撑。

360智脑团队宣布推出全新的Light-IF系列模型,这一创新框架旨在显著提升大型语言模型(LLM)在复杂指令遵循方面的能力。随着人工智能技术的不断进步,尽管LLM在数学、编程等领域已经展现出了卓越的推理能力,但在遵循复杂指令方面仍存在不足。为了解决这一问题,360智脑团队提出了以预览-自检式推理和信息熵控制为核心的Light-IF框架。 Light-IF框架通过五个关键环节来提升模型性能:难度感知指令生成、Zero-RL强化学习、推理模式提取与过滤、熵保持监督冷启动、熵自适应正则强化学习。这一框架的提出,旨在破解当前推理模型中存在的“懒惰推理”现象,即模型在思考阶段仅复述指令而不主动检查约束是否被满足
在人工智能技术日益发展的背景下,中国在海洋领域迎来了一个重要里程碑。3月24日,中国自然资源部宣布,国内首个业务化的垂域大模型 “瀚海智语” 正式发布,并顺利通过了专家评审。这一模型的推出,不仅为海洋行业的智能化转型提供了强有力的技术支持,也标志着我国在海洋人工智能应用领域迈出了重要一步。“瀚海智语” 是由国家海洋环境预报中心、海洋出版社有限公司和三六零数字安全科技集团有限公司联合开发,基于360智脑13B 和 Deepseek-R1-70B 两个大型模型。与通用大语言
近日,360智脑团队宣布成功复现Deepseek的强化学习效果,并正式发布开源推理模型 Light-R1-14B-DS。该模型性能表现超越 DeepSeek-R1-Distill-Llama-70B和 DeepSeek-R1-Distill-Qwen-32B,成为业界首款在14B参数规模上实现强化学习效果的模型,显著提升了数学推理能力,成绩超过大多数32B级别模型。与 DeepSeek-R1-14B 相比,Light-R1-14B-DS*在数学竞赛任务中表现突出:在 AIME24测试中提升4.3分,在 AIME25中更是提高10分。此外,在数学推理任务 GPQA 上,该模型取得61.7分 的优异成绩。为实现这一突破,360智脑团队采用了两
360智脑团队与北京大学联合研发的中等量级推理模型 Tiny-R1-32B-Preview 正式发布。这一模型仅以5%的参数量,成功逼近了 Deepseek-R1-671B 的满血性能,展现了小模型在高效推理领域的巨大潜力。该模型在多个关键领域的表现尤为突出。在数学领域,Tiny-R1-32B-Preview
360集团的创始人、董事长及CEO周鸿祎近日宣布,公司的360安全大模型将向公众免费开放。周鸿祎强调,360集团的目标是普及大模型技术,使其不再是只有少数厂商能够利用来盈利的稀有资源。他期望通过这一举措,让更多企业和个人能够负担得起并有效利用大模型技术,从而推动安全行业的技术进步和生产力的变革。