Reka AI是由十幾個谷歌DeepMind前科學家們創辦的公司,近日他們擲出了其首個開源模型—— Reka Flash3。這款擁有 210億參數 的推理模型,一經亮相便引發業內外的廣泛關注。
別看 Reka Flash3只有210億參數,據官方介紹,這款模型是 從零開始訓練 的通用推理模型。它不僅在 合成和公共數據集 上進行了監督式微調,還通過 基於模型和規則的強化學習(RLOO) 進行了深度優化。
如此“內外兼修”,使得 Reka Flash3在性能上展現出驚人的實力,甚至 超越了 Command A 和 Gemma327B 等參數量更大的模型。
更令人興奮的是,Reka Flash3被譽爲 同等規模開源模型中的佼佼者。這意味着開發者們終於有了一個性能強大且免費的“趁手兵器”,可以更自由地探索和構建各種創新應用。
Reka Flash3的能力可不止停留在簡單的文本生成。它背後蘊藏着諸多令人期待的功能特點:
- 推理能力強勁:作爲一款通用推理模型,Reka Flash3在邏輯 reasoning 方面自然有着不俗的表現。無論是回答複雜問題,還是進行多步推理,相信它都能展現出“聰明”的一面。
- 低延遲與設備部署友好:官方特別強調,Reka Flash3是一款 低延遲 的模型,並且非常適合 在設備上進行部署。這意味着未來我們可能會在手機、平板電腦等終端設備上,直接體驗到這款強大模型帶來的便捷服務。這簡直是“效率至上”時代的福音!
- Nexus 平臺的核心驅動:Reka Flash3不僅是一個獨立的模型,它還是 Reka AI 全新平臺 Nexus 的核心驅動力。Nexus 平臺旨在幫助組織 創建和管理 AI 工作者,這些 AI 工作者擁有 原生深度研究能力,可以 瀏覽網頁、執行代碼以及分析包括文檔、圖像、視頻和音頻在內的內部文件。
- “思考”機制與預算控制:Reka Flash3在生成輸出之前會進行“思考”,並使用特定的 標籤 來標記思考過程的開始和結束。有趣的是,Reka AI 還提供了一種 “預算強制” 機制,允許用戶在模型思考一定步數後強制其輸出,即使思考尚未完成,但通常仍能產生合理的結果。
儘管 Reka Flash3能力出衆,但官方也坦誠地指出,作爲一個較小的模型,它 並非知識密集型任務的最佳選擇。對於這類需求,Reka AI 建議 將 Reka Flash3與網絡搜索等工具相結合 使用,讓模型擁有更廣闊的知識來源。
模型:https://top.aibase.com/tool/reka-flash-3