宇樹開源 UnifoLM-VLA-0 大模型：爲通用人形機器人注入“物理常識”

宇樹宣佈正式開源 UnifoLM-VLA-0大模型。作爲 UnifoLM 系列中專門針對通用人形機器人操作設計的視覺-語言-動作（VLA）模型，它標誌着機器人大腦從單純的“圖文理解”向具備“物理常識”的具身智能跨出了關鍵一步。

技術突破:從感知到行動的深度融合

UnifoLM-VLA-0旨在打破傳統視覺語言模型（VLM）在物理交互中的侷限性:

具身大腦進化:通過在機器人操作數據上的持續預訓練，使模型能夠理解物理世界的交互規律，而非僅僅停留在語義層面。

空間細節對齊:模型深度融合了文本指令與2D/3D 空間細節，顯著增強了在複雜環境下的空間感知與位置推理能力。

動力學約束:集成了動作分塊預測及前向/逆向動力學約束，實現了對長時序動作序列的統一建模。

研發架構:基於 Qwen2.5-VL 的二次進化

宇樹利用系統化清洗後的多任務數據集對模型進行了打磨:

核心基座:基於 Qwen2.5-VL-7B 開源模型構建。

高效訓練:僅利用約340小時的真機數據進行離散動作預測訓練，便實現了高質量的任務泛化。

性能評估:在空間理解基準測試中，其表現不僅遠超基座模型，在特定模式下甚至可比肩 Gemini-Robotics-ER1.5。

實戰表現:單一策略搞定12類複雜任務

在宇樹 G1人形機器人平臺上的驗證結果令人矚目:

多任務通用性:該模型在同一策略網絡（checkpoint）下，能夠穩定完成包括物體抓取、放置等在內的12項複雜操作任務。

強大的魯棒性:真機實驗表明，即使在面對外部擾動時，機器人依然能保持良好的執行穩定性與抗干擾能力。

目前，宇樹已在GitHub及項目主頁完整公開了模型代碼與相關資料，旨在助力全球開發者共同推動通用人形機器人的商業化落地進程。

廣告即服務：谷歌搜索的“AI式重塑”，將付費推薦精準嵌入對話流

在2026年I/O大會上，谷歌宣佈對搜索業務進行25年來最重大重構，將Gemini 3.5 Flash全面植入，推出AI驅動的新型廣告格式。這些廣告打破傳統搜索廣告與結果的界限，從被動展示進化爲主動對話式服務。通過Gemini的推理能力，商業信息被深度整合，實現更智能、更自然的交互體驗。

五角大樓成立工作組加速 AI 工具在敏感網絡中的應用

五角大樓網絡作戰部門正組建專門工作組，加速在敏感網絡中部署先進AI工具。此舉爲應對私營部門AI模型快速涌現帶來的安全隱患，這些模型能比頂級黑客更快發現數字系統漏洞。兩週前，國家安全局和網絡司令部領導人約書亞·拉德將軍通過內部郵件宣佈，工作組旨在研究如何提升網絡安全防禦能力。

廣告即服務：谷歌搜索的“AI式重塑”，將付費推薦精準嵌入對話流