在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,

在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,
福客AI獲阿里巴巴戰略投資,雙方將聚焦電商數字生產力提升。合作旨在將AI技術融入商家運營,優化客戶接待、服務體驗與經營質量。福客AI將藉此強化產品體系,覆蓋服務、導購、商品、交易及售後等關鍵環節,加速AI與商家實際需求的結合。
人工智能行業快速發展引發用戶焦慮,Anthropic公司Claude Code產品負責人Cat Wu指出,AI高速迭代導致“錯失恐懼症”(FOMO),用戶需頻繁關注社交平臺獲取最新功能更新。過去產品發佈頻率爲每月或每季度一個新功能,用戶可偶爾查看,但如今節奏加快,加劇了不安情緒。
騰訊雲在TokenHub平臺推出DeepSeek-V4預覽版API,支持百萬級上下文長度,顯著提升自然語言處理能力。定價與DeepSeek官方一致,提供高性價比服務,並在國際站新加坡節點同步上架,覆蓋全球用戶。
加拿大初創企業Cohere與德國初創企業Aleph Alpha達成200億美元合作,共同開發“主權”人工智能系統,旨在建立不依賴美國和中國的人工智能架構,推進跨大西洋技術自主性。Cohere專注自然語言處理,Aleph Alpha擅長推理模型,雙方將結合技術優勢,加速AI自主發展。
Perplexity首席執行官Aravind Srinivas指出,AI進步不會顛覆智能手機市場,反而會使iPhone演變爲“數字護照”。隨着AI系統依賴上下文生成結果,存儲支付、健康、通信等個人數據的iPhone成爲關鍵基礎設施,重要性隨AI能力提升而凸顯,蘋果芯片是長期被低估的優勢。