字节跳动联合北京大学的研究团队在arXiv发表论文,介绍了他们用于训练大语言模型的生产系统MegaScale。MegaScale搭建了超过10000块GPU的单一集群,实现了55.2%的模型FLOP利用率。该系统还包含一套诊断工具用于监控系统组件和事件,找出根本原因,并实现容错和缓解滞后问题。
相关推荐
争夺云端主导权:字节与阿里拟于春节期间发布新一代大模型
字节跳动与阿里巴巴计划在春节前后发布新一代底层模型技术,竞争进入白热化。字节跳动将推出三款核心模型,涵盖语言处理、图像生成及视频领域,挑战市场格局。
2026年1月30号 9:00
170.4k
字节跳动豆包手机二代即将来袭,合作范围不断扩展!
字节跳动加速AI硬件布局,计划2026年推出第二代豆包手机,并与努比亚合作开发。同时,公司采取“自研+合作”策略,拓展打车等生态合作。
2026年1月29号 16:17
199.6k
自变量机器人获10亿元注资,获字节跳动与红杉中国联合领投
国内通用机器人企业“自变量机器人”近日完成10亿元A++轮融资,投资方包括字节跳动、红杉中国等顶级机构及地方产业平台。本轮融资是深创投专项新技术基金的首笔投资,字节跳动的加入也引发关注。
2026年1月12号 10:26
115.1k
抖音在深圳南山设立第二总部,布局 AI 与泛视频研发新高地
深圳宣布首批222个重点项目,包括抖音第二总部“泛视频类科技研发总部”,位于南山区。该项目将助力抖音在大湾区的技术研发与创新,打造集泛视频研发与新业务于一体的产业集群,支持抖音、今日头条等核心产品发展。
2026年1月8号 11:19
142.4k
字节跳动紧急否认!豆包AI眼镜“即将上市”传闻不实,称“无明确销售计划”
字节跳动否认豆包AI眼镜上市传闻,称目前无明确销售计划,相关产品已进入出货阶段的说法不实。此前有报道称该眼镜重量不足50克,需搭配App使用。
2026年1月6号 11:18
152.7k
