人工智能硬件初創公司Groq發佈了兩款開源語言模型,這兩款模型在專門工具使用能力方面勝過科技巨頭。新的 Llama-3-Groq-70B-Tool-Use 模型已經在伯克利函數調用排行榜(BFCL)上奪得榜首,超越了來自 OpenAI、谷歌和 Anthropic 等公司的專有產品。
Groq 的項目負責人 Rick Lamers 在一篇 X.com 的文章中宣佈了這一突破。他說:“我很自豪地宣佈 Llama3Groq Tool Use8B 和70B 模型。這是 Llama3的一個開源工具使用全精調版本,在 BFCL 上達到了第一名的位置,擊敗了所有其他模型,包括專有模型如 Claude Sonnet3.5、GPT-4Turbo、GPT-4o 和 Gemini1.5Pro。”

合成數據和道德人工智能:模型訓練中的新範式
更大的70B 參數版本在 BFCL 上達到了90.76% 的總體準確率,而較小的8B 模型得分爲89.06%,在總體上排名第三。這些結果表明,開源模型在特定任務中可以與甚至超越封閉源替代品的性能。
Groq 與人工智能研究公司 Glaive 合作開發了這些模型,使用了 Meta 的 Llama-3基礎模型上的全精細調和直接偏好優化(DPO)。團隊強調他們只使用道德生成的合成數據進行訓練,解決了關於數據隱私和過擬合的常見擔憂。
這些模型現在通過 Groq API 和 Hugging Face 平臺提供。這種可訪問性可以加速需要複雜工具使用和函數調用的領域的創新,例如自動編碼、數據分析和交互式人工智能助手。
Groq 還在 Hugging Face Spaces 上推出了一個公共演示,讓用戶可以與模型互動並第一手測試其工具使用能力。和 Hugging Face 在2021年12月收購的 Gradio 一樣,許多 Hugging Face Spaces 上的演示都是這樣製作的。人工智能社區對此做出了積極迴應,許多研究人員和開發人員都急於探索這些模型的能力。
劃重點:
⭐ Groq 發佈的開源 AI 模型在特定任務中勝過了科技巨頭的專有模型
⭐ 通過使用合成數據訓練,Groq 挑戰了 AI 模型開發中常見的數據隱私和過擬合問題
⭐ 開源模型的推出可能改變 AI 領域的發展路徑,促進更廣泛的 AI 可訪問性和創新生態系統的培育
