Colossal-AI 团队通过低成本构建了中文版的 LLaMA-2 大模型,在多个评测榜单中取得了优异的成绩。他们开源了完整的训练流程、代码及权重,并提供了评估体系框架 ColossalEval。这一方案可用于构建任意垂类领域的大模型,为 AI 应用带来了更多的可能性。
相关推荐
视频会议巨头“跨界”登顶,Zoom 凭借联邦 AI 刷新全球最难 AI 考试纪录
视频会议巨头Zoom在顶级AI基准测试中刷新世界纪录,以48.1%的成绩超越谷歌等巨头,其成功关键在于采用联邦式AI路径,而非直接训练底层模型。
2026年1月16号 10:58
157.2k
百度文心 ERNIE-5.0-0110 正式发布,数学能力全球第二
百度发布新一代文心大模型ERNIE-5.0-0110,在LMArena全球文本排行榜中以1460分位列第八,是唯一进入前十的中国国产大模型。其数学处理能力尤为突出,已升至全球第二,仅次于GPT-5.2-High。
2026年1月15号 15:30
204.2k
光云科技澄清AI业务:未自研大模型,相关收入占比小,未来贡献存不确定性
光云科技澄清AI业务布局,公司仅接入第三方大模型,未自主研发底层技术,AI产品收入占比小,尚未形成规模回报。
2026年1月13号 9:59
140.4k
深度求索计划于2月中旬发布 DeepSeek-V4,代码生成能力大幅提升
深度求索计划于2月中旬推出新一代旗舰模型DeepSeek-V4,重点提升代码生成和长代码上下文处理能力。该模型在内部测试中表现已超越Claude和GPT系列,尤其在长代码提示处理方面优势明显。
2026年1月12号 14:45
222.9k
马斯克宣布将开源新版 X 算法,引发外界关注
马斯克宣布下周将开源X平台新版算法,涵盖内容推荐与广告推送的核心代码。此举旨在提升透明度,回应公众对社交媒体内容分发机制的关注。此前X平台开源代码已三年未更新。
2026年1月12号 9:33
141.5k
