阿布扎比技術創新研究院(TII)發佈新一代開源AI模型Falcon3,憑藉14萬億token的訓練量和優化的架構設計,在消費級硬件上的性能表現創下新紀錄。這一訓練規模是其前代產品Falcon2的兩倍有餘。
Falcon3系列共推出四種規格:1B、3B、7B和10B,每種規格均提供基礎版和針對對話優化的Instruct版本。儘管專門提供英語、法語、西班牙語和葡萄牙語版本,但各型號都能處理大多數常用語言。
在Hugging Face的第三方語言模型評測中,Falcon3擊敗了包括Meta的Llama-3.1-8B、Qwen2.5-7B、Mistral的NeMo-12B和谷歌的Gemma2-9B在內的主流開源模型,展現出強勁的競爭力。
Falcon3在相關基準測試中的表現優於 Mistral、阿里巴巴、Meta 和谷歌等類似規模的競爭對手。| 圖片:技術創新研究所
TII特別強調了模型的易用性,確保與標準API和庫的兼容性,併爲特定硬件配置提供資源優化的量化版本。同時,研究院還推出了一款免費的聊天機器人,供用戶測試和反饋。該產品在界面設計上借鑑了ChatGPT的成功經驗,實現了項目文件夾等類似功能。
展望未來,TII計劃在2025年初擴展Falcon3系列的能力,將推出支持圖像、視頻和語音處理的多模態模型。目前,所有型號均可在Hugging Face平臺上免費下載,採用基於Apache2.0的TII Falcon許可證,其中包含了促進負責任AI使用的指導原則。
Falcon Chat 與 ChatGPT 界面非常相似,並且內置了類似的功能。| 圖片:THE DECODER 的截圖
這次發佈標誌着開源AI領域的又一重要進展,尤其是在提升消費級硬件上的AI性能方面取得了突破性成就。隨着多模態能力的加入,Falcon3有望在2025年爲AI開源社區帶來更多創新應用可能。