Colossal-AI 团队通过低成本构建了中文版的 LLaMA-2 大模型,在多个评测榜单中取得了优异的成绩。他们开源了完整的训练流程、代码及权重,并提供了评估体系框架 ColossalEval。这一方案可用于构建任意垂类领域的大模型,为 AI 应用带来了更多的可能性。
相关推荐
阿里云大模型价格腰斩!通义千问3-Max调用费直降50%,缓存命中仅收10%费用
阿里云百炼宣布自2025年11月13日起,通义千问3-Max模型核心调用费用减半,并优化缓存计费策略,大幅降低企业AI应用成本。此举旨在降低大模型使用门槛,加速中小企业数字化转型。
2025年11月14号 9:22
147.0k
字节跳动大模型研究员因泄密被开除!曾频繁在知乎曝光机器人研发细节,公司重拳整治信息安全
字节跳动大模型团队研究员任某某因多次泄露公司保密信息被辞退。他在知乎拥有8万粉丝,曾频繁发布内部研发细节,引发关注并导致公司纪律审查。高调分享最终酿成职业危机。
2025年11月13号 11:21
162.9k
微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型
微博AI部门推出开源大模型VibeThinker-1.5B,拥有15亿参数。该模型基于阿里Qwen2.5-Math-1.5B优化,在数学和代码任务表现优异。现已在Hugging Face等平台免费开放,遵循MIT许可证,支持商业使用。
2025年11月13号 9:14
202.2k
GPT-5.1正式发布!不光更聪明,还会“共情”:新增6种人格风格,AI首次纳入情感依赖安全评估
OpenAI发布GPT-5.1,标志AI竞赛进入"情商融合"新阶段。模型重点强化情绪价值、个性化交互与人性化表达,解决用户反馈的"AI冰冷"问题。采用双模型架构:Instant模式快速响应,Thinking模式深度思考。全球分批推送中,付费用户3个月内可继续使用GPT-5过渡。
2025年11月13号 8:59
192.9k
月之暗面开源AI代理新框架Kosong!异步编排+插件化设计,开发者自由度拉满
月之暗面开源AI代理框架Kosong,以轻量灵活特性助力下一代智能体开发。该框架通过统一抽象层解决工具碎片化问题,简化开发流程,旨在打通大模型与实际应用场景,引发开发者社区广泛关注。
2025年11月11号 9:02
140.6k
