大语言模型迎来了“1-bit时代”,微软和中国科学院大学提出的BitNet b1.58方法将参数转换成三进制表示,从根本上减少了模型的内存占用和简化了计算过程。该方法在不同大小的模型上进行了性能比较,速度提高了并减少了内存使用,引发了网友们的热议和讨论。
相关推荐
日本数据科学家推出“零错误”编程语言 Sui,声称让大模型写代码准确率达100%
日本数据科学家本田崇人推出全新编程语言Sui,其设计理念源自日本美学“粋”,追求极致精炼。该语言通过消除语法错误、用数字代替变量名、确保每行代码独立运行,旨在解决大模型生成代码时常见的语法、命名混乱及上下文依赖问题,提升代码生成质量。
2025年12月16号 17:39
203.2k
蚂蚁开源 LLaDA2.0,业内首个100B 参数规模的扩散语言模型
蚂蚁技术研究院发布LLaDA2.0系列,包含16B和100B版本,其中100B版为业内首个百亿参数离散扩散大语言模型。该模型突破扩散模型规模化瓶颈,显著提升生成质量与推理速度,为领域发展提供新方向。
2025年12月12号 16:14
320.3k
阿里通义推出新型强化学习方法 SAPO,让大语言模型更稳更强
阿里通义Qwen团队推出Soft Adaptive Policy Optimization(SAPO),旨在解决大语言模型强化学习中策略优化不稳定的问题。相比传统硬剪切方法,SAPO通过自适应调整更新幅度,避免过于严格限制,提升训练稳定性和效率。
2025年12月10号 17:53
184.5k
普惠算力新解法:英博云如何通过 K8S 原生架构降低 AI 研发门槛
大模型时代,算力需求激增,但中小企业与科研机构面临GPU获取难题:本地部署成本高、维护难;传统云服务配置复杂、调度不灵活。需探索更经济、灵活的算力解决方案。
2025年12月3号 13:59
148.9k
我国首个无障碍 AI 伴读系统星光 AI 伴读 “小星”,助力盲童阅读
我国首个盲童无障碍AI伴读系统“小星”正式上线,由中国盲文出版社与科技公司联合研发。该系统搭载大语言模型,支持盲童通过手机或电脑免费使用,可随时提问书籍内容、词义和情节,满足视障读者特殊阅读需求。
2025年12月3号 9:00
155.4k
