淘天集团联合爱橙科技开源了大模型训练框架 Megatron-LLaMA,旨在提升大语言模型的训练性能,降低训练成本,并与 LLaMA 社区保持兼容性。框架在 32 卡训练上能够取得 176% 的加速,对网络不稳定也表现出高容忍度。Megatron-LLaMA 将关注自适应最优配置选择、模型结构改动的支持以及在不同硬件环境下的极致性能训练解决方案。
相关推荐
腾讯与人大高瓴联合推出开源规划评测框架 PlanningBench
腾讯混元团队与中国人民大学等机构联合开源了PlanningBench,这是一个用于评测和训练大语言模型规划能力的框架。它系统化地抽象了任务、约束和难度,覆盖30多种规划任务类型,支持数据生成与验证,旨在评估模型的实际规划能力。
2026年6月5号 17:34
289.4k
GPT 5.5 称霸 AI 漏洞挑战,DeepSeek 斩获“性价比之王”
安全研究员Kasra Rahjerdi通过构建含漏洞的图书评论应用,测试主流大语言模型的安全推理能力。他故意暴露谷歌移动端后端服务凭据,要求模型解包并识别以访问数据库。在每场2小时、预算10美元的严格条件下,评估了顶尖模型的表现。
2026年6月4号 16:55
242.7k
GPT-5. 5 拿下利用率冠军,DeepSeek V4 Pro斩获性价比之王!大模型网络安全攻防实测报告出炉
大语言模型在网络安全领域的推理能力正面临严峻考验。安全研究员Kasra Rahjerdi通过构建含有核心漏洞的图书评论APK,对主流大模型进行模拟黑客攻击测试,揭示其安全推理与漏洞利用的真实水平。测试限时2小时、单次预算10美元,直观展现了各模型在复杂逻辑挑战中的表现。
2026年6月4号 15:56
294.1k
恶意开发者利用Claude编写恶意包:超670个受污染npm包威胁开源生态安全
近期,一名恶意开发者利用Anthropic的AI模型Claude协助编写恶意代码,向npm仓库推送超670个含恶意脚本的软件包,大规模污染包管理器生态。该事件暴露了大语言模型被用于自动化开发恶意软件的风险,引发网络安全行业高度警惕。
2026年5月28号 10:35
201.3k
连自己名字都拼不对?谷歌AI搜索屡屡“翻车”引发用户集体卸载
谷歌近期升级其“AI概览”搜索功能,试图将传统搜索引擎转变为对话式引擎,但遭遇重大挫败。用户测试发现,该AI系统频繁出现低级拼写错误,如误判“poop”中字母“r”的数量,将“journalism”拼错为“journadism”,甚至无法正确拼写母公司名称“Google”。这些错误暴露了AI在基础文字处理上的短板,引发广泛质疑。
2026年5月28号 8:54
156.4k
