正文

微软6页论文爆火：三进制LLM，真香！

发布于AI新闻资讯

发布时间 :2024年2月29号 15:39

阅读 :1分钟

大语言模型迎来了“1-bit时代”，微软和中国科学院大学提出的BitNet b1.58方法将参数转换成三进制表示，从根本上减少了模型的内存占用和简化了计算过程。该方法在不同大小的模型上进行了性能比较，速度提高了并减少了内存使用，引发了网友们的热议和讨论。

网络快餐还是精神断粮？AI生成文章已全面碾压人类创作

AI生成的英文文章数量已超过人类，每两篇内容中有一篇出自机器。这类低质内容被称为“Slop”，如糖蜜般泛滥于社交平台，导致人类原创文字可能成为稀缺品，思维边界正悄然塌陷。

英国数学家图灵1950年提出的图灵测试设想，在76年后由加州大学圣地亚哥分校研究团队在《美国国家科学院院刊》发表论文证实。认知科学家卡梅伦·琼斯和本·伯根教授通过严格的经典三方图灵测试，首次提供确凿实证数据，标志着计算机科学史上的里程碑时刻。

阿里云在5月20日峰会上宣布，其大模型服务平台“百炼”强化开放生态，接入多家第三方顶尖模型，覆盖文本、图像、视频及多模态生成等领域。此举标志着百炼从阿里自研“千问”模型的展示台，转型为涵盖全行业主流模型的“AI模型超级市场”，首批接入的模型矩阵丰富多元。

湖北潜江警方在侦破一起工地柴油盗窃案时，面对无监控、无目击证人的“零线索”现场，借助字节跳动旗下AI大模型工具“豆包”，将案发现场提取的1440mm关键轮距数据输入模型，成功实现案件突破。这展现了大语言模型向基层社会治理和智慧警务领域渗透的实战价值。

AMD发布vLLM-ATOM插件，专为大语言模型部署优化，在不改变现有工作流下，显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制，利用vLLM框架的高显存利用率优势，让开发者以低学习成本实现技术迁移，获得性能平滑升级。

智启未来，您的人工智能解决方案智库