Arcee AI 今天推出了 SuperNova,這是一個爲企業提供部署、具有先進指令遵循能力和完全定製選項的700億參數語言模型。該模型旨在爲企業數據隱私、模型穩定性和定製化方面提供強大、可擁有的替代方案,以應對基於API服務(如 OpenAI 和 Anthropic)的關鍵問題。
在由雲API主導的AI領域中,Arcee AI 通過 SuperNova 採取了不同的方法。這個大型語言模型(LLM)可以在企業自己的基礎設施內部署和定製。SuperNova 今天發佈,基於 Meta 的 Llama-3.1-70B-Instruct 架構,並採用了 Arcee 聲稱的優越的指令遵循能力和適應特定業務需求的新穎後訓練過程。
技術創新
SuperNova 的開發涉及多方面的後訓練方法
項目首席工程師 Lucas Atkins 透露了祕籍:“我們訓練了三個模型,一個是從 Llama405B 蒸餾的精華,一個是用我們的 EvolKit 生成的數據集喂大的,還有一個是在 Llama3instruct 上進行了深度 DPO 的改造。最後,我們用一種新魔法把它們合體,保留了每個模型的超能力。”
Arcee 聲稱這造就了 SuperNova 的指令遵循能力,特別是從405B 參數模型的蒸餾,這不僅顯示了 SuperNova 在保持適中硬件部署的同時,還能捕捉到更大模型的精髓。
企業部署和定製
SuperNova 旨在部署在企業自己的雲環境中,首先在 AWS Marketplace 上可用。Arcee 也在努力使其在 Google 和 Azure 市場上可用。
Arcee AI 的聯合創始人 Mark McQuade 強調了這種部署方式的好處:“模型部署在你的 AWS VPC 中,但它還會啓動一個網絡服務器、一個聊天界面和一個數據庫來存儲你的聊天曆史。組織中的每個人都可以和它親密互動。”
這種部署方式,解決了企業對數據隱私和模型穩定性的擔憂。和那些可能會在不通知的情況下改變的基於 API 的服務不同,SuperNova 給了企業完全的控制權。McQuade 指出,鑑於 AI 行業最近的動盪,這一點尤爲重要:“OpenAI 剛剛拋棄了3.5……很多公司都圍繞3.5的 API 建立了業務。所以那個 API 一變,你的應用程序就掛了。但在我們的世界裏,除非你想變,否則什麼都不會變,因爲這是你的模型,你的方式來運行它。”
定製和持續改進
SuperNova 的一大賣點是它能夠在企業環境中進行微調和重新訓練。
Atkins 解釋了這個過程及其好處:“隨着時間的推移,我們可以完全在你自己的環境下重新訓練模型,以更好地符合你的偏好。隨着我們保存這些聊天,如果你希望模型根據你作爲企業的獨特偏好全面改進,我們有能力這樣做,而不必讓數據離開你的系統。”
這種能力讓技術團隊能夠將模型適應特定領域的知識或公司特定的要求。這和那些通常不允許這種程度定製的基於雲的 API 服務相比,無疑是一個巨大的優勢。
開源組件
雖然完整的70B 模型不是開源的,但 Arcee 正在爲開發人員社區發佈幾個組件:
免費API用於測試和評估: 這允許開發人員在不承諾全面部署的情況下嘗試 SuperNova。
SuperNova-Lite: 一個8B 參數的開源版本模型。這個較小的模型對於在資源受限的環境中工作的開發者或那些在部署完整模型之前想要了解架構的開發者可能有用。
EvolKit: 他們的數據集生成管道,用於創建複雜的QA對。這個工具對於希望爲其特定用例創建自定義訓練數據的組織來說可能很有價值。
通過開源這些組件,Arcee 爲更廣泛的AI社區做出了貢獻,同時也爲潛在客戶提供了評估和定製其產品的工具。Arcee SuperNova 也在 AWS Marketplace 上可用。
性能聲明和基準測試
Arcee 聲稱 SuperNova 在各個領域表現良好,特別是在數學推理方面。“Atkins 指出:“這個在數學基準測試中非常出色。”然而,公司鼓勵第三方評估以驗證他們的聲明。
“我們將提供一個 API 供人們使用。如果有第三方想要運行可信的基準測試來自己評估,我們可以安排提供給他們訪問權重的權限。我們希望對這個模型有完全的透明度。” Atkins 說。
這種對第三方評估的開放性值得稱讚,因爲它允許獨立驗證 Arcee 的聲明。看到 SuperNova 在標準基準測試中的表現與 OpenAI、Anthropic 等領先 AI 公司模型相比將特別有趣。
企業AI戰略的影響
SuperNova 的發佈正值許多企業正在重新評估其 AI 戰略之際。雖然基於雲的 API 服務一直主導着這個領域,但對可部署、可定製的模型的興趣日益增長,這些模型提供了更多的控制和靈活性。
SuperNova 的方法解決了幾個關鍵問題:
- 數據隱私:通過在公司自己的基礎設施內部署,SuperNova 確保敏感數據永遠不會離開組織的控制。
- 模型穩定性:與可能會在不通知的情況下更改或廢棄的 API 服務不同,SuperNova 提供了一個穩定的基礎,只有在組織選擇更新時纔會更改。
- 定製化:能夠在公司特定數據上微調和重新訓練模型的能力,允許進行大多數 API 服務無法實現的深度定製。
- 成本控制:雖然初始部署可能需要大量資源,但運行 SuperNova 的長期成本可能低於大規模支付 API 調用的成本。
- 競爭優勢:一個定製的、持續改進的 AI 模型可以在 AI 驅動洞察至關重要的行業中提供顯著的競爭優勢。
AI主權困境
隨着企業在快速發展的 AI 領域中導航,SuperNova 的發佈揭示了行業中日益增長的緊張關係:雲基礎 AI 服務的便利性和能力與可部署模型提供的控制和定製之間的權衡。這種二分法提出了我們可能稱之爲“人工智能主權困境”。
一方面,像 GPT-4和 Claude 這樣的基於雲的 API 服務提供了最先進的性能和持續更新,但代價是數據隱私問題和有限的定製化。另一方面,像 SuperNova 這樣的模型承諾完全控制和定製,但需要在內部專業知識來部署和維護。
Arcee 通過 SuperNova 採取的方法試圖彌合這一差距,提供了一個可以在本地部署的模型,同時仍然提供旨在與領先的基於雲的服務相媲美的能力。這種混合方法可能特別吸引那些有嚴格監管要求的行業或那些處理高度敏感數據的行業。
官方博客:https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/