人工智能正從單純的“問答機器”演變爲能夠直接操控電腦的“行動派”。6月25日,谷歌正式發佈了全新的 Gemini3.5Flash 模型,其核心亮點在於深度優化了“計算機操作(computer use)”能力,旨在讓 AI 能夠直接接管電腦界面,自主完成複雜的跨軟件工作流。
此次更新標誌着 Gemini 定位的重大轉變。傳統的 AI 模型多停留在文本生成與信息檢索,而 Gemini3.5Flash 則被賦予了更多“代勞”的權限。它不僅在編程、科研等專業領域表現出極強的任務處理能力,更能在複雜的操作環境中充當主動執行的智能體。官方基準測試顯示,該模型在處理編碼任務及自主代理任務上的表現,已超越了3.1Pro 版本,且在響應速度上實現了顯著提升,完美契合自動化辦公、工具調用等高頻交互場景。

在實際應用中,Gemini3.5Flash 的表現令人矚目。它能夠處理長鏈條式的複雜任務,例如獨立完成從零開始的系統構建、管理繁瑣的研究項目等。通過 Flash 架構的深度優化,谷歌在確保響應“高質量”的同時,將模型運行速度推向了新高,使得 AI 代理在處理持續性任務時更加順暢,最大限度地減少了人工參與的必要性。
目前,這項技術已全面覆蓋谷歌的生態系統。Gemini 應用及搜索的 AI 模式現已默認搭載該模型,開發者也可以通過 Gemini API 或企業版工具調用相關能力。此外,谷歌還宣佈,新一代個人 AI 代理 Gemini Spark 也將由該模型提供底層驅動,進一步推動 AI 輔助任務的自動化進程。
伴隨能力進化,安全防護也成爲重中之重。谷歌明確表示,針對更強自主能力的 AI 代理,已同步強化了網絡安全及 CBRN(化學、生物、放射性和核)相關領域的風險控制。在面對高風險或敏感請求時,模型不再僅僅是簡單的拒絕,而是引入了可控框架,在必要時會主動暫停並尋求人工確認,確保任務執行既高效又安全。隨着 Gemini3.5Flash 的發佈,人機交互的邊界被再次拓寬,AI 直接操控數字世界的時代正在加速到來。
