谷歌最近發佈了名爲 A2UI(代理到用戶界面)的新標準,賦予人工智能代理即時創建圖形用戶界面的能力。這一開源項目旨在規範 AI 如何生成視覺響應,使其不僅限於發送文本,而是能夠直接生成表單、按鈕等用戶界面元素,從而提升用戶體驗。

image.png

傳統上,AI 與用戶的交互多通過純文本進行,處理複雜任務時往往顯得繁瑣。以餐廳預訂爲例,客服人員可以利用 A2UI 立即生成一個包含日期選擇器和可用時間的完整表單,避免了冗長的文字溝通。A2UI 的目標是創建 “情境感知界面”,能夠根據對話進展自動調整界面。

A2UI 的設計摒棄了傳統的 iframe 和可執行代碼的方式,研究團隊指出,這種做法存在安全隱患且視覺效果較差。相反,A2UI 通過傳輸 JSON 數據,讓客戶端利用本地組件渲染出原生 UI 元素。這樣一來,代理僅能在預定義組件內工作,降低了代碼注入的風險,同時確保了應用程序對界面外觀的完全控制。

在智能用戶界面領域,A2UI 與 Anthropic 的模型上下文協議(MCP)和 OpenAI 的 ChatKit 有明顯區別。MCP 通常將用戶界面視爲一種資源,而 A2UI 則強調與宿主應用的深度集成。與 OpenAI 的 ChatKit 相比,A2UI 更注重平臺無關性,旨在支持複雜的多代理架構,實現更高效的協調和展示。

谷歌近期在 Gemini 應用和搜索中展示了 A2UI 的實際應用,推出了 “動態視圖” 功能,能夠實時創建交互式工具和圖形界面,使複雜概念更易於理解。目前,A2UI 的版本爲0.8,已經在多個生產環境中投入使用,包括 Flutter 的 GenUI SDK 和谷歌內部的小程序平臺 Opal。

谷歌還與多個外部框架建立了合作關係,以推動 A2UI 的應用。AG UI 和 CopilotKit 團隊早已支持該協議,項目已發佈適用於 Flutter、Web Components 和 Angular 的客戶端庫,正在邀請開發者貢獻更多渲染器與集成功能。

劃重點:  

🌟 A2UI 標準使 AI 能夠實時生成用戶界面元素,提升用戶體驗。  

🔒 該標準通過數據傳輸而非代碼生成,降低安全風險。  

🌐 A2UI 與其他智能用戶界面標準相比,強調與宿主應用的深度集成。