谷歌推出全新的开源模型系列「Gemma」,Gemma 与 Llama 2、Mistral 相比表现出色,具有独特的设计原则。Gemma 使用GeGLU激活函数,参数规模较大但能够取代其他开源模型,展示了强大潜力。
相关推荐
谁是谁的“老师”?Mistral CEO 称 DeepSeek 借鉴其架构引发技术圈热议
Mistral CEO称中国DeepSeek-V3基于其架构,引发关于AI创新归属的争议。核心围绕稀疏混合专家模型技术是借鉴还是自主创新。
2026年1月26号 14:09
166.7k
Starcloud 在太空中成功训练大型语言模型
Starcloud公司利用搭载NVIDIA H100GPU的卫星,在太空中成功训练了nano-GPT模型并完成Gemma模型推理,标志着太空数据中心发展的重要进展。
2025年12月11号 16:57
172.3k
首个太空数据中心诞生!Starcloud 在轨道上训练大语言模型
初创公司Starcloud成功在太空轨道上训练大语言模型,成为全球首例。其卫星搭载英伟达H100芯片,并运行基于谷歌开源模型Gemma的应用程序,开启了太空数据中心的新纪元。公司计划为客户提供商业服务,卫星发回的信号展示了其独特视角。
2025年12月11号 11:18
194.7k
法国 AI 公司 Mistral 发布新模型,力求与 OpenAI 和谷歌保持竞争
法国AI公司Mistral发布新模型,旨在追赶谷歌、OpenAI等全球领先实验室。此次推出包括号称“最佳开放权重多模态多语言模型”的大型模型,以及适用于机器人设备的小型模型,凸显全球AI领域竞争加剧。
2025年12月3号 9:47
147.0k
汇丰银行与 Mistral 达成合作,借助 AI 提升运营效率
汇丰银行与AI公司Mistral合作,引入先进AI工具提升业务效率,重点优化多语言文档处理、翻译及文件分析等内部流程,以技术创新推动运营升级。
2025年12月1号 14:15
154.6k
