阿里雲開源通義DeepResearch:輕量級AI代理，性能比肩OpenAI

阿里雲通義實驗室今日宣佈，已將通義DeepResearch完全開源。這款開創性的Web代理工具，以僅300億參數（實際激活30億）的輕量級規模，在性能上實現了對標OpenAI深度研究工具的突破。

通義DeepResearch在多項權威基準測試中表現卓越，包括在Humanity's Last Exam中獲得32.9分，在BrowseComp上取得45.3分，並在xbench-DeepSearch中斬獲75.0的高分，這標誌着開源AI智能體在複雜信息檢索和推理領域取得了重大進展。

該代理專爲處理多步、長週期的深度信息蒐集任務而設計，支持128K的超長上下文。它能夠將複雜問題高效分解，進行多步推理，並整合海量數據。其背後的技術創新包括智能體數據持續預訓練和on-policy強化學習，這使得它在處理多輪交互和實時數據處理的場景中，如多日行程規劃和法律文檔分析，表現出強大的穩定性和可靠性。

通義DeepResearch提供兩種推理模式:適用於輕量級任務的單模型ReAct模式，以及通過多Agent並行協作、支持算力擴展的Heavy模式。目前，該技術已在實際應用中落地，例如集成到高德地圖，幫助用戶規劃個性化多日行程;同時，它也賦能法律助手“通義法睿”，顯著提升了合同風險評估和案件分析的效率。

作爲阿里雲通義系列大模型生態的重要一環，通義DeepResearch的開源將極大地降低AI代理的開發門檻。該系列此前已開源超過200款不同參數規模的模型，並催生了Hugging Face平臺上超過10萬個二次開發模型。專家認爲，此次開源將爲開發者和小型團隊提供強大的基礎，幫助他們快速構建出特定領域的AI智能體。

“龍蝦”爆火後的安全警示:國安部發布 OpenClaw 安全養殖手冊

2026年，開源AI工具OpenClaw（暱稱“龍蝦”）因強大的自主執行能力成爲現象級產品。隨着“養龍蝦”熱潮興起，其原生安全風險引發國家關注。國家安全部發布《“龍蝦”安全養殖手冊》，提醒用戶理性辨別、規範使用。OpenClaw的核心優勢在於從方案生成到自主執行，區別於僅提供建議的傳統大模型。

通義DeepResearch發佈！全開源AI模型讓研究更簡單

在人工智能領域，通義 DeepResearch 團隊最新發布的研究成果引發了廣泛關注。這一突破性進展不僅使 AI 從 “能聊天” 躍升至 “會做研究”，更是以開放的姿態向世界展示了其卓越的性能。通義 DeepResearch 在多個權威基準測試中取得了最先進的成績，整體能力甚至超過了許多國際知名模型，並且模型、框架及方案都實現了完全開源，真正把深度研究的生產力帶給每個人。相較於國際上昂貴且受限的模型，通義 DeepResearch 團隊選擇了完全開放的方式，提供了一系列工具與方案。在多個測試項目

Manus開源平替！Kortix-AI正式發佈開源通用AI智能體平臺Suna

Kortix-AI正式發佈開源通用AI智能體平臺Suna，定位爲熱門AI工具Manus的開源替代品。據AIbase瞭解，Suna集成了瀏覽器自動化、文件管理、網絡爬蟲、擴展搜索、命令行執行、網站部署及API集成等功能，通過自然語言對話實現複雜任務的自動化處理。項目已在GitHub上線，憑藉其強大的功能集與開源特性，迅速成爲AI開發者和自動化愛好者的關注焦點。核心功能:多維能力驅動智能自動化Suna以其全面的功能套件和模塊化設計，爲用戶提供了從數據處理到流程自動化的完整解決方案。AIbase梳理了其主要

國內首個AI大模型衆測結果出爐！發現281個安全漏洞，未來治理刻不容緩

在第22屆中國網絡安全年會（暨國家網絡安全宣傳週網絡安全協同防禦分論壇）上，國內首次針對AI大模型的衆測結果揭曉。此次活動由中央網信辦網絡安全協調局指導，國家計算機網絡應急技術處理協調中心主辦，吸引了559名白帽子安全專家參與，對15款AI大模型和應用產品進行了全面的安全漏洞測試。這項測試涵蓋了從基礎大模型到智能體和模型開發平臺等多種產品，旨在從攻擊者的角度發掘潛在的安全隱患。結果顯示，共發現各類安全漏洞高達281個，其中大模型特有漏洞就有177個，比

全球首位 AI 全棧工程師 “Orchids” 問世

近日，一款名爲 “Orchids”的新型人工智能產品，稱其爲全球首位 AI 全棧工程師問世。Orchids在用戶界面（UI）和全棧開發能力方面表現優異，分別在 UI Bench 和 Design Arena 中名列前茅，超越了多個知名競爭對手，包括 Devin、Lovable、Cursor、Bolt、Replit 以及 v0等。Orchids的功能多樣，不僅可以開箱即用地實現前端和後端開發，還支持身份驗證、數據庫管理和支付功能，完全無需依賴第三方服務。這一特點使得Orchids在開發流程中變得更加高效便捷，極大地簡化了開發者的工作量。用戶可以利用Orchid