大语言模型迎来了“1-bit时代”,微软和中国科学院大学提出的BitNet b1.58方法将参数转换成三进制表示,从根本上减少了模型的内存占用和简化了计算过程。该方法在不同大小的模型上进行了性能比较,速度提高了并减少了内存使用,引发了网友们的热议和讨论。
相关推荐
图灵测试尘埃落定:GPT-4. 5 胜率超真人,AI学会了完美撒谎
英国数学家图灵1950年提出的图灵测试设想,在76年后由加州大学圣地亚哥分校研究团队在《美国国家科学院院刊》发表论文证实。认知科学家卡梅伦·琼斯和本·伯根教授通过严格的经典三方图灵测试,首次提供确凿实证数据,标志着计算机科学史上的里程碑时刻。
2026年5月22号 14:58
188.3k
阿里云百炼重磅升级:全栈开放接入,打造模型“超级市场”
阿里云在5月20日峰会上宣布,其大模型服务平台“百炼”强化开放生态,接入多家第三方顶尖模型,覆盖文本、图像、视频及多模态生成等领域。此举标志着百炼从阿里自研“千问”模型的展示台,转型为涵盖全行业主流模型的“AI模型超级市场”,首批接入的模型矩阵丰富多元。
2026年5月21号 15:14
213.6k
AI大模型在基层执法落地,豆包助力警务破案跑出“加速度”
湖北潜江警方在侦破一起工地柴油盗窃案时,面对无监控、无目击证人的“零线索”现场,借助字节跳动旗下AI大模型工具“豆包”,将案发现场提取的1440mm关键轮距数据输入模型,成功实现案件突破。这展现了大语言模型向基层社会治理和智慧警务领域渗透的实战价值。
2026年5月18号 15:44
217.3k
加速国产大模型:AMD推出vLLM-ATOM插件大幅提升推理效率
AMD发布vLLM-ATOM插件,专为大语言模型部署优化,在不改变现有工作流下,显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制,利用vLLM框架的高显存利用率优势,让开发者以低学习成本实现技术迁移,获得性能平滑升级。
2026年5月12号 11:40
319.5k
谷歌警告:黑客首次利用 AI 开发 “零日” 漏洞攻击工具
谷歌安全团队首次发现黑客利用AI技术开发出可绕过主流管理软件的攻击工具,该工具利用“零日”漏洞实施攻击。此类漏洞因开发商未发现而无法提前修复,引发对网络安全新威胁的广泛关注。
2026年5月12号 8:54
153.6k
