人工智能初創公司HyperWrite的首席執行官Matt Shumer宣佈了一個重要的里程碑:他們推出了基於Meta開源Llama3.1-70B Instruct的Reflection70B模型。這款新模型不僅在第三方基準測試中表現卓越,還被譽爲“世界上最強大的開源AI模型”。

Shumer在社交網絡X上分享了這一消息,並展示了Reflection70B在多個測試中超越Meta Llama系列的圖表,其性能甚至可與頂級商業模型相媲美。消息一出,HyperWrite的演示網站訪問量激增,團隊目前正在尋找更多的GPU資源以滿足用戶需求。

image.png

Reflection70B的獨特之處在於其自我糾錯技術。Shumer指出,現有的大型語言模型(LLM)可能會產生錯誤,但往往缺乏自我修正的能力。Reflection70B通過在生成文本後回顧和評估其準確性,確保提供給用戶的答案的可靠性。

該模型引入了幾種新的特殊符號,使用戶能夠以更結構化的方式與模型互動。在推理過程中,模型會在特殊標籤內輸出其推理過程,從而實現實時錯誤糾正。在演示網站上,用戶可以嘗試提問,如“‘Strawberry’這個詞中有多少個字母‘r’?”或“9.11和9.9哪個數字更大?”等簡單問題,Reflection70B經過一定時間的處理後,能夠給出正確答案。

Reflection70B的這一特性使其非常適合需要高精度的任務。它通過將推理過程分解爲幾個明確的步驟,提高了結果的準確性。現在,Reflection70B已經可以通過AI代碼庫Hugging Face下載,API接入也將很快通過GPU服務提供商Hyperbolic Labs推出。

此外,HyperWrite正在努力將Reflection70B模型集成到其主要的AI寫作助手產品中,預計將於下週發佈更強大的版本——Reflection405B。Shumer透露,他們正在不斷探索如何將這一技術更好地應用於實際產品中。

Reflection70B的成功也離不開Glaive公司的貢獻。Glaive專注於生成特定用例的數據集,極大地加速了模型的訓練。Glaive的平臺能夠迅速生成高質量的合成數據,幫助公司快速且經濟地微調模型,解決了AI開發中高質量、任務特定數據可用性的主要瓶頸。

HyperWrite作爲一家位於長島的AI初創公司,自2020年由Shumer和Jason Kuperberg共同創立以來,一直在AI領域積極探索。最初是一款Chrome擴展,後來發展成爲能夠處理更復雜任務的AI助手,擁有200萬用戶的龐大基礎,並獲得了《福布斯》年度“30Under30”榜單的榮譽。

HyperWrite最近一輪融資於2023年3月披露,獲得了280萬美元的資金,投資者包括Madrona Venture Group。這些資金支持了HyperWrite推出新的AI驅動功能,將網頁瀏覽器變成虛擬助手,可以完成從預訂航班到在LinkedIn上尋找求職者等各種任務。

Shumer強調,準確性和安全性始終是HyperWrite的首要任務,尤其是在探索複雜自動化任務時。該平臺還在不斷通過用戶反饋進行監測和改進,以完善其個人助手工具。這種謹慎的做法,正如Reflection70B中嵌入的結構化推理和反思,體現了Shumer對精確和責任感的承諾。

模型下載地址:https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B