在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,

在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,
Perplexity推出“2025年回顧”工具,通過預設提示幫助用戶總結年度活動,但被指內容較簡單。OpenAI也推出“你的ChatGPT年度總結”功能,提供個性化年度回顧。
字節跳動計劃在2026年投入約1600億元人民幣用於AI基礎設施建設,其中約850億元將用於採購先進AI處理器,以縮小與美國科技巨頭的差距。
瑞典AI初創公司Lovable完成3.3億美元B輪融資,估值達66億美元,較7月增長超三倍。本輪由CapitalG和Menlo Ventures領投,英偉達、Salesforce Ventures及德國電信跟投。公司核心技術爲文本提示生成AI。
優必選旗下優奇與火山引擎合作,整合機器人本體與雲端AI技術,加速大模型在工業物流領域的應用。雙方將圍繞多模態大模型、VLA模型、世界模型及豆包生態展開合作,推動技術規模化落地。
國家知識產權局發佈首批18項“人工智能+”知識產權公共服務應用場景,覆蓋12個省份,標誌着我國知識產權服務智能化轉型邁出實質性步伐。各地創新實踐各具特色,如北京聚焦海外維權與未來產業創新,上海探索基於大模型的專利動態分析。