IBM 發佈 Granite4.0Nano 系列:爲邊緣 AI 量身打造的小型開源模型

近日，IBM AI 團隊推出了 Granite4.0Nano 系列，這是一個專爲本地和邊緣推理而設計的小型模型家族，旨在爲企業提供更強的控制能力和開源許可。該系列包含8個模型，分爲350M 和約1B 兩種規模，採用混合 SSM 和變換器架構，支持基本和指令兩種模式，所有模型均在 Apache2.0許可下發布，且能夠在 vLLM、llama.cpp 和 MLX 等流行運行時環境中原生運行。

Granite4.0Nano 系列包括四條模型線及其基礎版本。其中，Granite4.0H1B 採用混合 SSM 架構，參數數量約爲1.5B;而 Granite4.0H350M 同樣採用混合方法，參數數量爲350M。爲了確保最大的運行時兼容性，IBM 還提供了 Granite4.01B 和 Granite4.0350M 的變換器版本。

這些 H 變體模型交替使用 SSM 層和變換器層設計，這種混合結構在內存增長方面相較於純變換器有顯著優勢，同時保持了變換器模塊的通用性。Granite4.0Nano 模型沒有采用減少數據管道，而是遵循與大規模 Granite4.0模型相同的訓練方法，使用超過15萬億個標記進行訓練，並經過指令調整，以提高工具使用和指令遵循能力。

IBM 還將 Granite4.0Nano 與其他同類模型進行了比較，包括 Qwen、Gemma 和 LiquidAI LFM，結果顯示在通用知識、數學、代碼及安全性等領域，Granite4.0Nano 的表現顯著提升。此外，該系列模型在代理任務上也在 IFEval 和伯克利函數調用排行榜第3版中表現出色。

這些模型經過 ISO42001認證，並且以加密簽名的形式發佈，確保了企業級使用所需的可追溯性和治理能力。用戶可以通過 Hugging Face 和 IBM watsonx.ai 訪問這些模型，並在邊緣、本地和瀏覽器級別上進行部署，幫助早期 AI 工程師和軟件團隊更好地實現項目。

huggingface:https://huggingface.co/collections/ibm-granite/granite-40-nano-language-models

劃重點:
🔹 IBM 發佈了 Granite4.0Nano 系列，包含8個模型，適用於邊緣 AI 推理。
🔹 該系列模型基於超過15萬億個標記進行訓練，確保了性能的繼承性。
🔹 所有模型均經過 ISO42001認證，並具有企業級治理能力，支持多種運行環境。

IBM 發佈 Granite4.0Nano 系列:爲邊緣 AI 量身打造的小型開源模型

相關推薦

軟銀攜手Sierra在日本推出AI客服服務，客戶滿意度從74%飆升至93%

DeepSeek梁文鋒身價飆升至 360 億美元，成AI公司新首富

DeepSeek完成74億美元融資，梁文鋒身家升至360億美元

代碼100%由AI編寫： 9 年iOS開發者 15 天打造外賣遊戲，斬獲2. 5 萬美元獎金

面壁智能CTO曾國洋：從“打字機”到大模型，端側AI的進化與突圍

IBM 發佈 Granite4.0Nano 系列:爲邊緣 AI 量身打造的小型開源模型

相關推薦

軟銀攜手Sierra在日本推出AI客服服務，客戶滿意度從74%飆升至93%

DeepSeek梁文鋒身價飆升至 360 億美元，成AI公司新首富

DeepSeek完成74億美元融資，梁文鋒身家升至360億美元

代碼100%由AI編寫： 9 年iOS開發者 15 天打造外賣遊戲，斬獲2. 5 萬美元獎​金

面壁智能CTO曾國洋：從“打字機”到大模型，端側AI的進化與突圍

代碼100%由AI編寫： 9 年iOS開發者 15 天打造外賣遊戲，斬獲2. 5 萬美元獎金