近日,IBM 推出了四款新的 Granite4.0Nano 模型,這一系列模型的參數規模從350萬到15億不等,展示了公司在人工智能領域對高效與可及性的重視。與行業中大型模型普遍依賴雲計算的趨勢不同,Granite4.0Nano 模型可以在普通的筆記本電腦上運行,甚至可以在瀏覽器中本地運行。這使得開發者能夠在不依賴雲服務的情況下,構建適用於消費者硬件或邊緣設備的應用。

image.png

所有 Granite4.0Nano 模型均在 Apache2.0許可下發布,適合研究人員、企業和獨立開發者使用,且支持商業用途。這些模型與各種工具兼容,如 llama.cpp、vLLM 和 MLX,並獲得了 ISO42001負責任 AI 開發的認證。

Granite4.0Nano 家族包括四款模型:Granite-4.0-H-1B(約1.5億參數)、Granite-4.0-H-350M(約350萬參數)、Granite-4.0-1B(接近2億參數的變種)和 Granite-4.0-350M(變種)。其中,H 系列模型採用混合狀態空間架構,適用於低延遲的邊緣環境,而標準的變壓器模型則提供了更廣泛的兼容性。

儘管市場上已有許多小型語言模型,但 IBM 的 Nano 家族憑藉卓越的性能脫穎而出。最新的基準測試顯示,Granite4.0模型在多個領域的表現優於同類競爭對手。IBM 的研究團隊表示,這些模型在指令跟隨和功能調用任務中表現突出,並且在內存需求和運行速度上具有優勢,能夠在移動設備或 CPU 上流暢運行。

image.png

值得一提的是,IBM 不僅發佈了這些模型,還積極與開發者社區進行互動,收集反饋並討論未來的開發計劃。Granite 團隊在 Reddit 平臺上與用戶進行交流,展現了公司在推動開放源代碼 AI 發展方面的努力。

huggingface:https://huggingface.co/blog/ibm-granite/granite-4-nano

劃重點:

🌟 IBM 發佈了 Granite4.0Nano 模型,支持在普通硬件上運行,提升了小型 AI 模型的可用性。  

🛠️ 所有模型均在 Apache2.0許可下發布,適合研究和商業用途,確保了開放性和兼容性。  

📈 最新基準測試顯示,Granite4.0模型在性能上超越同類產品,展現了高效的處理能力。