在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,

在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,
字節跳動開源Lance,一款僅3B激活參數的原生統一多模態大模型,打破“理解模型(VLM)”與“生成模型(DiT/Diffusion)”的技術壁壘。它以極致輕量化實現全功能覆蓋,挑戰當前AI行業堆砌參數或“拼積木”組裝模型的風氣,成爲技術創新的重要突破。
Google在年度營銷大會上推出基於Gemini大模型的新一代搜索廣告格式,將AI深度融入廣告體驗,幫助品牌商在用戶研究和決策中實現精準場景連接。隨着用戶藉助AI模式做出更快消費決策,傳統搜索引擎流量入口被重構。新廣告格式能提供高度個性化的內容,提升廣告效果。
國家發改委在5月新聞發佈會上表示,正會同有關部門加快推動人工智能賦能千行百業。目前,國家人工智能應用中試基地已落地醫療領域,孵化出“螞蟻阿福”等健康AI應用,並在多省市醫療機構推廣,讓居民享受智能服務。此舉旨在滿足核心技術與應用需求,推動AI基礎設施及行業應用發展。
智譜發佈GLM-5.1高速版API,輸出速度達400 tokens/s,刷新全球大模型API速度紀錄,突破速度與體積不可兼得的行業認知。
CapCut與Google Gemini App達成合作,用戶將可直接在Gemini應用內調用CapCut的高級編輯功能,便捷完成圖像和視頻創作。此舉標誌着創意工具間的深度融合,推動創作流程更互聯、對話化和直觀化,實現智能集成。CapCut表示這只是開端。