谷歌推出全新的開源模型系列「Gemma」,Gemma 與 Llama 2、Mistral 相比表現出色,具有獨特的設計原則。Gemma 使用GeGLU激活函數,參數規模較大但能夠取代其他開源模型,展示了強大潛力。
相關推薦
誰是誰的“老師”?Mistral CEO 稱 DeepSeek 借鑑其架構引發技術圈熱議
Mistral CEO稱中國DeepSeek-V3基於其架構,引發關於AI創新歸屬的爭議。核心圍繞稀疏混合專家模型技術是借鑑還是自主創新。
Jan 26, 2026
166.7k
Starcloud 在太空中成功訓練大型語言模型
Starcloud公司利用搭載NVIDIA H100GPU的衛星,在太空中成功訓練了nano-GPT模型並完成Gemma模型推理,標誌着太空數據中心發展的重要進展。
Dec 11, 2025
172.3k
首個太空數據中心誕生!Starcloud 在軌道上訓練大語言模型
初創公司Starcloud成功在太空軌道上訓練大語言模型,成爲全球首例。其衛星搭載英偉達H100芯片,並運行基於谷歌開源模型Gemma的應用程序,開啓了太空數據中心的新紀元。公司計劃爲客戶提供商業服務,衛星發回的信號展示了其獨特視角。
Dec 11, 2025
194.7k
法國 AI 公司 Mistral 發佈新模型,力求與 OpenAI 和谷歌保持競爭
法國AI公司Mistral發佈新模型,旨在追趕谷歌、OpenAI等全球領先實驗室。此次推出包括號稱“最佳開放權重多模態多語言模型”的大型模型,以及適用於機器人設備的小型模型,凸顯全球AI領域競爭加劇。
Dec 3, 2025
147.0k
匯豐銀行與 Mistral 達成合作,藉助 AI 提升運營效率
匯豐銀行與AI公司Mistral合作,引入先進AI工具提升業務效率,重點優化多語言文檔處理、翻譯及文件分析等內部流程,以技術創新推動運營升級。
Dec 1, 2025
154.6k
