相關推薦
華盛頓州立大學研究:ChatGPT 在複雜科學判斷中表現出嚴重的“自相矛盾”
華盛頓州立大學研究發現,ChatGPT在處理複雜科學論斷時準確率有限,表現接近隨機猜測,且常給出前後矛盾的回答。研究團隊測試了719條研究假設,模型表面正確率約80%,但實際可靠性不足。
Mar 19, 2026
177.1k
DeepSeek代碼庫現神祕標識符“MODEL1”,新一代旗艦或於 2 月亮相
國產AI公司DeepSeek在GitHub代碼庫中更新FlashMLA代碼,被發現大量指向未知模型“MODEL1”的標識符。該標識符與現有V3.2版本並列提及,暗示這可能是一個全新的模型序列,而非簡單迭代。
Jan 21, 2026
224.9k
IBM 發佈 Granite 4.0 Nano 模型,突破小型 AI 模型的性能極限
IBM發佈Granite4.0Nano系列AI模型,參數規模350萬至15億,強調高效與可及性。模型可在筆記本電腦或瀏覽器本地運行,無需依賴雲計算,支持開發者在普通硬件或邊緣設備構建應用,突破行業依賴雲服務的常規趨勢。
Oct 29, 2025
196.8k
性價比之王!Anthropic 推出 Claude Haiku 4.5,編程能力媲美 Sonnet 4 僅需三分之一的價格!
Anthropic發佈小型AI模型Claude Haiku4.5,以低成本實現接近前沿性能,專爲實時低延遲任務設計,如聊天助手和客戶服務。Claude系列含Haiku、Sonnet、Opus三種尺寸,大模型雖知識廣但速度慢成本高,Haiku通過“蒸餾”技術平衡效率與性能。
Oct 16, 2025
226.8k
馬斯克旗下 xAI 發佈 Grok 4 Fast:速度提升十倍但細節有所妥協
據testingcatalog報道,近日,xAI 正式推出了 Grok4Fast,這是一款全新的模型,用戶可以通過 Grok 網頁版的模型選擇器來訪問。爲了體驗這一新功能,用戶需要在訂閱設置中啓用一個新的早期訪問模式切換按鈕。Grok4Fast 最大的亮點在於其速度,用戶反饋稱該模型的響應速度比標準的 Grok4快了多達10倍。這一版本的主要特點是優化了快速響應,儘量減少在複雜任務上的處理時間。例如,當被要求創建一個機器人 SVG 時,Grok4Fast 會提供相對簡單的輸出,這表明該模型更注重速度,而非作品的複雜性。
Sep 15, 2025
201.4k
