Vidu Q1震撼升級:參考轉視頻支持最多七張圖像，AI視頻生成再創新高

中國AI視頻生成領域領軍者Vidu近日宣佈，其Q1模型迎來重大升級，推出了全新的“參考轉視頻”（Reference-to-Video）功能，允許用戶上傳最多七張參考圖像，生成視覺一致性極高的1080p視頻。這一功能突破了傳統AI視頻生成在多場景和多主體一致性上的瓶頸，爲創作者提供了前所未有的靈活性和創作自由。

參考轉視頻:七張圖像解鎖複雜敘事

Vidu Q1的“參考轉視頻”功能是此次更新的核心亮點。用戶可上傳最多七張參考圖像，包括人物、場景、道具等元素，結合文本提示詞生成高質量視頻。Vidu Q1通過先進的語義融合技術，確保多張圖像中的元素在視頻中保持高度一致，避免了傳統AI視頻生成中常見的場景斷裂或角色失真問題。

例如，用戶可上傳一張人物照片、一張森林背景和一張動物圖像，輸入提示詞:“一名女性在森林中彈吉他，貓頭鷹停在樹枝上。”Vidu Q1能夠智能生成包含吉他演奏動作、森林環境和貓頭鷹的視頻，畫面細節如服裝紋理、背景光影和動物動作均高度逼真。這一功能爲動畫、短視頻和廣告創作者提供了強大的工具，顯著降低了複雜場景的製作門檻。

多主體一致性:打造連貫視覺體驗

Vidu Q1的多主體一致性（Multiple-Entity Consistency）技術是其核心競爭力之一。用戶可通過上傳不同類型的參考圖像(如角色、物體、環境)，生成包含多主體互動的視頻，且每個主體的特徵在整個視頻中保持穩定。例如，上傳一張角色照片、一件花紋服裝和一輛自行車圖片，Vidu Q1可生成一段角色穿着指定服裝、騎行自行車的流暢視頻，細節如花紋和自行車造型均與參考圖像高度吻合。

與上一代模型相比，Q1在畫面細節和動作流暢度上顯著提升，支持多角度鏡頭切換和動態場景過渡，確保360°視角下的視覺一致性。這一功能尤其適合動漫、遊戲預告片和虛擬場景模擬等需要複雜敘事的場景，爲專業創作者提供了接近傳統影視製作的創作體驗。

Hugging Face 推出 Reachy Mini 機器人，賦能開源 AI 開發者

Hugging Face推出兩款Reachy Mini桌面機器人套件：無線版449美元和Lite版299美元，專爲AI開發者設計。這些開源機器人可編程、支持Python，預裝演示程序並與Hugging Face Hub平臺深度集成。CEO表示產品基於社區反饋開發，旨在讓開發者自由創造AI應用。Lite版下月發貨，無線版年底交付。公司強調開源硬件理念，反對機器人技術被少數公司壟斷。

OpenAI收購艾維創辦的AI硬件公司，交易金額近65億美元

OpenAI以65億美元全股票收購喬納森·艾維創立的AI硬件公司io Products，正式進軍硬件市場。收購後io團隊併入OpenAI，艾維的設計公司LoveFrom保持獨立但繼續參與設計工作。這是OpenAI史上最大交易，獲得包括前蘋果設計師在內的專業團隊。交易曾因商標糾紛暫停宣傳資料，6月完成監管審批後正式落地。此次收購將強化OpenAI在AI硬件領域的佈局，整合頂尖設計資源開發新型智能設備。

OpenAI斥資65億美元收購艾維AI公司，佈局硬件市場！

OpenAI以65億美元全股票收購蘋果前設計總監艾維創立的AI設備公司io Products，正式進軍硬件領域。此次收購爲OpenAI帶來曾參與iPhone設計的頂尖團隊，艾維將深度參與產品設計。儘管此前因商標糾紛遭遇波折，這仍是OpenAI史上最大收購案。CEO奧特曼表示，此舉將推動AI技術與硬件融合，未來將推出更創新的AI設備。收購標誌着OpenAI在科技市場競爭中邁出重要一步。

微軟利用 AI 技術節省5 億美元成本並再度裁員近萬人

微軟AI應用成效顯著：呼叫中心節省5億美元成本，35%新代碼由AI生成，GitHub Copilot用戶達1500萬。但AI推廣也帶來結構性調整，公司宣佈裁員9000人以控制AI基礎設施投資成本，延續今年累計裁員2.4萬人的趨勢。科技行業普遍面臨AI自動化帶來的崗位變革，Salesforce等企業30%工作已由AI完成，引發員工"替代焦慮"。AI在提升效率的同時，正重塑行業就業格局。

OpenAI 即將推出顛覆性AI瀏覽器，直逼谷歌Chrome

OpenAI計劃推出AI瀏覽器挑戰谷歌Chrome，該產品基於Chromium開發，整合ChatGPT技術，擁有4億潛在用戶。其創新點在於AI代理功能可自動完成網頁操作，減少傳統瀏覽步驟。此舉可能威脅谷歌66%的市場份額及其廣告生態系統。目前行業正興起AI瀏覽器熱潮，OpenAI憑藉技術優勢試圖搶佔先機，若成功將動搖谷歌在用戶數據和廣告投放領域的主導地位。