性能超越GPT-4o 和 Claude 3.5 Sonnet！超強的Reflection 70B 模型登場

人工智能初創公司HyperWrite的首席執行官Matt Shumer宣佈了一個重要的里程碑:他們推出了基於Meta開源Llama3.1-70B Instruct的Reflection70B模型。這款新模型不僅在第三方基準測試中表現卓越，還被譽爲“世界上最強大的開源AI模型”。

Shumer在社交網絡X上分享了這一消息，並展示了Reflection70B在多個測試中超越Meta Llama系列的圖表，其性能甚至可與頂級商業模型相媲美。消息一出，HyperWrite的演示網站訪問量激增，團隊目前正在尋找更多的GPU資源以滿足用戶需求。

Reflection70B的獨特之處在於其自我糾錯技術。Shumer指出，現有的大型語言模型（LLM）可能會產生錯誤，但往往缺乏自我修正的能力。Reflection70B通過在生成文本後回顧和評估其準確性，確保提供給用戶的答案的可靠性。

該模型引入了幾種新的特殊符號，使用戶能夠以更結構化的方式與模型互動。在推理過程中，模型會在特殊標籤內輸出其推理過程，從而實現實時錯誤糾正。在演示網站上，用戶可以嘗試提問，如“‘Strawberry’這個詞中有多少個字母‘r’?”或“9.11和9.9哪個數字更大?”等簡單問題，Reflection70B經過一定時間的處理後，能夠給出正確答案。

Reflection70B的這一特性使其非常適合需要高精度的任務。它通過將推理過程分解爲幾個明確的步驟，提高了結果的準確性。現在，Reflection70B已經可以通過AI代碼庫Hugging Face下載，API接入也將很快通過GPU服務提供商Hyperbolic Labs推出。

此外，HyperWrite正在努力將Reflection70B模型集成到其主要的AI寫作助手產品中，預計將於下週發佈更強大的版本——Reflection405B。Shumer透露，他們正在不斷探索如何將這一技術更好地應用於實際產品中。

Reflection70B的成功也離不開Glaive公司的貢獻。Glaive專注於生成特定用例的數據集，極大地加速了模型的訓練。Glaive的平臺能夠迅速生成高質量的合成數據，幫助公司快速且經濟地微調模型，解決了AI開發中高質量、任務特定數據可用性的主要瓶頸。

HyperWrite作爲一家位於長島的AI初創公司，自2020年由Shumer和Jason Kuperberg共同創立以來，一直在AI領域積極探索。最初是一款Chrome擴展，後來發展成爲能夠處理更復雜任務的AI助手，擁有200萬用戶的龐大基礎，並獲得了《福布斯》年度“30Under30”榜單的榮譽。

HyperWrite最近一輪融資於2023年3月披露，獲得了280萬美元的資金，投資者包括Madrona Venture Group。這些資金支持了HyperWrite推出新的AI驅動功能，將網頁瀏覽器變成虛擬助手，可以完成從預訂航班到在LinkedIn上尋找求職者等各種任務。

Shumer強調，準確性和安全性始終是HyperWrite的首要任務，尤其是在探索複雜自動化任務時。該平臺還在不斷通過用戶反饋進行監測和改進，以完善其個人助手工具。這種謹慎的做法，正如Reflection70B中嵌入的結構化推理和反思，體現了Shumer對精確和責任感的承諾。

模型下載地址：https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B

Meta 甩出“白盒手術刀”：CoT-Verifier 把 AI 推理失誤釘在歸因圖上

Meta AI推出CoT-Verifier模型，通過分析鏈式思維每一步的“電路軌跡”來定位推理錯誤。與傳統僅驗證輸出的方法不同，該模型先進行前向推理，再提取歸因圖，發現正確與錯誤推理的圖結構差異顯著。團隊利用輕量級分類器實現高效驗證，已在Hugging Face發佈。

富士康推出首款AI推理大模型 “FoxBrain”，商標申請已提交

近日，鴻海精密工業股份有限公司（也就是大家熟悉的富士康）在國家知識產權局商標局提交了 “FoxBrain” 商標註冊申請。這款 AI 推理大模型不僅是富士康的首次嘗試，更是臺灣地區首個該類型的 AI 模型。根據公開資料顯示，該商標的國際分類爲科學儀器，目前正處於 “等待實質審查” 的狀態。“FoxBrain” 是鴻海研究院重磅推出的 AI 推理大模型，涵蓋數據分析、數學推理、代碼生成等多個功能，功能豐富，極具潛力。富士康聲稱，FoxBrain 的初始版本基於 Meta 的 Llama3.1模型進行開發，使

富士康母公司註冊AI推理大模型商標

企查查APP顯示，近日，鴻海精密工業股份有限公司申請註冊“FoxBrain”商標，國際分類爲科學儀器，當前商標狀態爲註冊申請中。據媒體報道，FoxBrain是鴻海集團（富士康）旗下鴻海研究院自主研發的首款繁體中文AI推理大模型。該模型於今年3月正式發佈，基於Meta Llama3.1架構開發優化，專注於數學推演、邏輯分析與代碼生成領域。

Meta AI 知法犯法? 哈利波特42%內容被 Llama吞下，面臨鉅額訴訟

近期一項由斯坦福大學、康乃爾大學及西維吉尼亞大學研究人員發表的論文顯示，Meta 的 Llama3.1AI 模型能夠逐字重現大量受版權保護的書籍內容，這爲這家科技巨頭帶來了潛在的鉅額法律風險。研究指出，Llama3.170B 模型在測試中能夠重現《哈利波特:神祕的魔法石》高達42% 的文本內容，遠超第一代 Llama 模型的4.4%。人工智能模型，如 OpenAI 的 ChatGPT 和 Meta 的 Llama，通常通過海量數據訓練，旨在識別並生成新的模式。然而，該研究的關鍵發現是，Meta 的 Llama 模型似乎並非僅僅學習語言模式，而

富士康推出臺灣省首款 AI 推理大模型 “FoxBrain”