研究人員推出LPM1.0模型:實現單圖轉實時交互式數字人視頻

近日，研究人員正式發佈LPM1.0模型，該研究項目旨在通過單張參考圖像實時生成涵蓋說話、聆聽及唱歌行爲的人物視頻。LPM1.0的核心突破在於其多模態處理能力，能同步整合文本、音頻與圖像輸入，生成具備精確脣形同步、細膩面部表情及自然情緒過渡的動態畫面。該模型支持直接接入ChatGPT、豆包等主流語音AI，從而將傳統的語音對話升級爲具備視覺反饋的實時交互。

技術層面，LPM1.0引入了“多粒度身份條件化”技術，通過多角度、多表情的參考素材提取細節，無需模型自主生成如牙齒、皺紋或側面輪廓等複雜特徵，顯著提升了跨風格處理能力。無論是照片級寫實人臉、動漫還是3D遊戲角色，皆可實現無需二次訓練的即時驅動。此外，該模型支持流式傳輸技術，在長達45分鐘的視頻生成中仍能保持系統穩定性。

在交互邏輯上，LPM1.0能夠精準識別三種對話狀態:聆聽時生成點頭或目光偏移等反應性表情;說話時由音頻驅動肢體與脣動;停頓時則依據文本指令產生自然閒暇行爲。項目經理曾愛玲指出，LPM1.0不僅適用於實時對話，亦支持離線音頻驅動視頻生成，爲播客及影視創作提供了技術冗餘。

儘管展現出較強的應用潛力，開發團隊強調LPM1.0目前僅作爲研究項目，暫無公開發布代碼或權重的計劃。研究人員坦言，生成的視頻與真實影像間仍存在定性差距，且技術本身潛藏的深度僞造（Deepfake）風險不容忽視。該項研究的意義在於明確了未來AI系統的演進方向:即從單一的邏輯交互向具備情感響應、眼神交流及視覺具身化的全維度交互形態轉變。

Anthropic 發佈 Claude 安全隔離架構：三款產品展現多層防護策略

Anthropic工程團隊分享了開發三款AI產品（claude.ai、Claude Code和Claude Cowork）的安全隔離系統經驗。三款產品分別面向普通用戶、開發者和企業用戶，遵循“環境層隔離優先”原則。其中claude.ai採用基於gVisor的臨時容器方案，每次用戶會話都會生成臨時容器。

谷歌雲AI生態再迎超級大客戶！瑞典獨角獸 Lovable 簽約擴容 5 倍算力

瑞典初創公司Lovable與谷歌雲達成長期深度合作，雖未公開金額，但知情人士稱其雲資源和AI使用量將增至5倍。作爲歐洲增長最快的初創公司之一，Lovable在“全自動AI編碼”賽道表現搶眼，此次合作標誌着全球雲算力與AI生態的強強聯合。

谷歌“Ask Gemini” 功能已擴展至 Gmail，讓郵箱搜索變得輕鬆！

谷歌宣佈“Ask Gemini in Drive”功能擴展至Gmail，幫助用戶在海量郵件中快速查找特定信息。該功能於三月推出，現向符合條件的Google Workspace、AI Pro和Ultra用戶開放。用戶需在左側選擇Gmail爲查詢來源，點擊“Ask Gemini”按鈕即可使用。

GPT 5.5 稱霸 AI 漏洞挑戰，DeepSeek 斬獲“性價比之王”

安全研究員Kasra Rahjerdi通過構建含漏洞的圖書評論應用，測試主流大語言模型的安全推理能力。他故意暴露谷歌移動端後端服務憑據，要求模型解包並識別以訪問數據庫。在每場2小時、預算10美元的嚴格條件下，評估了頂尖模型的表現。

起訴馬斯克旗下xAI！英國議員痛斥Grok AI刻意放任色情深度僞造