正文

號稱最強模型Reflection 70B遭質疑，創始人面臨 “欺詐” 指控

發布於AI新閒資訊

時間 :Sep 10, 2024

閱讀 :1分鐘

剛剛登場不久的開源 AI 模型 Reflection70B，近日就遭到了業界的廣泛質疑。

這款由紐約初創公司 HyperWrite 發佈的模型，自稱是 Meta 公司的 Llama3.1變種，曾以其在第三方測試中的優異表現引發關注。然而，隨着一些測試結果的公佈，Reflection70B 的聲譽卻開始受到挑戰。

事情的起因是 HyperWrite 的聯合創始人兼 CEO Matt Shumer 於9月6日在社交媒體 X 上宣佈了 Reflection70B，並信心滿滿地稱其爲 “全球最強的開源模型”。

Shumer 還分享了關於這款模型的 “反射調優” 技術，聲稱這一方法能讓模型在生成內容前自我審覈，從而提升準確性。

然而，在HyperWrite宣佈後的第二天，專門進行“AI模型和託管提供商獨立分析”的組織Artificial Analysis在X上發佈了自己的分析，指出他們評估的Reflection Llama3.170B的MMLU（Massive Multitask Language Understanding）得分與Llama370B相同，但明顯低於Meta的Llama3.170B，這與HyperWrite/Shumer最初發布的結果存在重大差異。

Shumer隨後表示，Reflection70B的權重（或開源模型的設置）在上傳到Hugging Face(第三方AI代碼託管存儲庫和公司)的過程中出現了問題，這可能導致性能比HyperWrite的“內部API”版本差。

Artificial Analysis在隨後的聲明中表示，他們獲得了對私有API的訪問權限，並看到了令人印象深刻的性能，但並沒有達到最初的聲明水平。由於這次測試是在私有API上進行的，他們無法獨立驗證他們正在測試的內容。

該組織提出了兩個關鍵問題，嚴重質疑HyperWrite和Shumer最初的性能聲明:

爲什麼發佈的版本不是他們通過Reflection私有API測試的版本。
爲什麼他們測試的版本的模型權重尚未發佈。

同時，Reddit上的多個機器學習和AI社區的用戶也對Reflection70B的聲明性能和起源提出了質疑。一些人指出，根據第三方在Github上發佈的模型比較，Reflection70B似乎是Llama3的變體，而不是Llama-3.1的變體，這進一步對Shumer和HyperWrite最初的聲明產生了懷疑。

這導致至少有一位X用戶Shin Megami Boson在9月8日東

部時間晚上8:07公開指控Shumer在AI研究社區中存在“欺詐行爲”，併發布了一長串截圖和其他證據。

其他人則指控該模型實際上是構建在專有/封閉源代碼的競爭對手Anthropic的Claude3之上的“包裝器”或應用程序。

然而，也有其他X用戶站出來爲Shumer和Reflection70B辯護，一些人也發佈了他們端的模型的印象深刻的性能。

目前，AI研究社區正在等待Shumer對這些欺詐指控的迴應和Hugging Face上的更新模型權重。

🚀 Reflection70B 模型發佈後，性能受到質疑，測試結果未能復現初期聲稱的表現。
⚙️ HyperWrite 創始人解釋稱模型上傳問題導致性能下降，呼籲關注更新版本。
👥 社交媒體上對該模型的討論熱烈，既有指責也有辯護，形勢錯綜複雜。

Meta 甩出“白盒手術刀”：CoT-Verifier 把 AI 推理失誤釘在歸因圖上

Meta AI推出CoT-Verifier模型，通過分析鏈式思維每一步的“電路軌跡”來定位推理錯誤。與傳統僅驗證輸出的方法不同，該模型先進行前向推理，再提取歸因圖，發現正確與錯誤推理的圖結構差異顯著。團隊利用輕量級分類器實現高效驗證，已在Hugging Face發佈。

Nov 28, 2025

187.2k

富士康推出首款AI推理大模型 “FoxBrain”，商標申請已提交

近日，鴻海精密工業股份有限公司（也就是大家熟悉的富士康）在國家知識產權局商標局提交了 “FoxBrain” 商標註冊申請。這款 AI 推理大模型不僅是富士康的首次嘗試，更是臺灣地區首個該類型的 AI 模型。根據公開資料顯示，該商標的國際分類爲科學儀器，目前正處於 “等待實質審查” 的狀態。“FoxBrain” 是鴻海研究院重磅推出的 AI 推理大模型，涵蓋數據分析、數學推理、代碼生成等多個功能，功能豐富，極具潛力。富士康聲稱，FoxBrain 的初始版本基於 Meta 的 Llama3.1模型進行開發，使

Jul 2, 2025

130.3k

富士康母公司註冊AI推理大模型商標

企查查APP顯示，近日，鴻海精密工業股份有限公司申請註冊“FoxBrain”商標，國際分類爲科學儀器，當前商標狀態爲註冊申請中。據媒體報道，FoxBrain是鴻海集團（富士康）旗下鴻海研究院自主研發的首款繁體中文AI推理大模型。該模型於今年3月正式發佈，基於Meta Llama3.1架構開發優化，專注於數學推演、邏輯分析與代碼生成領域。

Jul 2, 2025

134.9k

Meta AI 知法犯法? 哈利波特42%內容被 Llama吞下，面臨鉅額訴訟

近期一項由斯坦福大學、康乃爾大學及西維吉尼亞大學研究人員發表的論文顯示，Meta 的 Llama3.1AI 模型能夠逐字重現大量受版權保護的書籍內容，這爲這家科技巨頭帶來了潛在的鉅額法律風險。研究指出，Llama3.170B 模型在測試中能夠重現《哈利波特:神祕的魔法石》高達42% 的文本內容，遠超第一代 Llama 模型的4.4%。人工智能模型，如 OpenAI 的 ChatGPT 和 Meta 的 Llama，通常通過海量數據訓練，旨在識別並生成新的模式。然而，該研究的關鍵發現是，Meta 的 Llama 模型似乎並非僅僅學習語言模式，而

Jun 18, 2025

215.5k

富士康推出臺灣省首款 AI 推理大模型 “FoxBrain”

3月10日，鴻海富士康在技術創新的道路上邁出了重要一步，正式推出其首款 AI 推理大模型 “FoxBrain”。這一模型不僅是富士康的自我突破，更標誌着臺灣省地區在 AI 推理領域的嶄新起點。富士康表示，FoxBrain 將涵蓋數據分析、數學運算、推理能力和代碼生成等多項功能，未來還計劃進行開源，以便於更廣泛的技術應用與社區合作。據富士康透露，該模型的訓練過程使用了120塊強大的英偉達 H100GPU，僅用一個月的時間便成功構建了該模型。FoxBrain 是基於 Meta Llama3.1開發而成，特別優化了繁體

Mar 11, 2025

238.0k

智啟未來，您的人工智能解決方案智庫