中國科學技術大學出品！AI人像視頻編輯工具PortraitGen：風格化、換衣、修改光照通通搞定

最近，中國科學技術大學的研究團隊推出了一款名爲 PortraitGen 的創新視頻編輯工具，只要輸入視頻，就可以實現文字修改人物效果、參考圖片修改人物效果，換衣，修改光照效果等多模態的人像編輯。

更令人興奮的是，這一切只需短短30分鐘，編輯後的人像視頻能夠以每秒100幀的速度流暢播放!

這項技術的核心在於追蹤 SMPL-X 係數，研究團隊首先對單目視頻進行追蹤，然後通過一種被稱爲神經高斯紋理的機制，構建出一個3D 高斯特徵場。

通過迭代更新數據集，用戶可以實現多樣化的人像編輯。特別值得一提的是，團隊還提出了一個 “面部意識編輯” 模塊，旨在提高表情質量並保留個性化的面部結構，編輯效果自然且細膩。

文本修改人物效果

PortraitGen 的編輯功能非常強大，用戶可以進行文本驅動和圖像驅動的編輯。

比如，文本驅動編輯使用了一種叫做 InstructPix2Pix 的2D 編輯模型，用戶只需輸入 RGB 圖像、文本指令和帶有噪聲的潛在圖像，系統便能根據這些信息進行精細的調整。

風格化編輯

而在圖像驅動編輯方面，團隊針對不同需求，採用了風格遷移和虛擬試穿等技術，讓用戶可以輕鬆地將風格轉移到視頻幀中，甚至實現換衣效果。

修改光照

更有趣的是，PortraitGen 還能夠根據用戶提供的光照描述來調節視頻幀的光照，使得整個視頻更加和諧美觀。

在與其他頂尖視頻編輯工具的對比中，PortraitGen 在提示保留、身份保留和時間一致性方面都表現得相當優越。

在技術細節上，PortraitGen 引入的神經高斯紋理技術，不同於以往的球諧係數方法，爲每個高斯點存儲可學習的特徵，使得編輯效果更爲豐富，能夠支持更復雜的樣式。

此外，通過人臉識別增強的編輯功能，以及優化表情一致性的表達，PortraitGen 展現了其在細緻人像編輯領域的強大潛力。

項目入口：https://top.aibase.com/tool/portraitgen

劃重點:
✨ PortraitGen 僅需30分鐘即可將2D 人像視頻編輯爲4D 高斯場，支持每秒100幀的流暢播放。
🎨 提供多種編輯方式，包括文本驅動和圖像驅動，讓視頻風格變換更加靈活多樣。
💡 通過面部意識編輯模塊，提升表情質量，並保留用戶個性化的面部特徵。

OpenAI推ChatGPT高級語音模式，新增五種聲音風格、免費用戶不可用

今日，OpenAI 正式宣佈將於本週內向所有 ChatGPT Plus 和 Team 用戶開放全新的高級語音模式。根據官方介紹，新功能不僅增加了自定義說明、記憶、五種新語音和改進的口音，還新增了5種不同的聲音和50多種語言選擇，讓用戶與 ChatGPT 的交流更加流暢和個性化。如果您是 Plus 或 Team 用戶，當有權訪問 Advanced Voice 時，就能在應用程序中看到一條通知。OpenAI 特別強調了這次語音模式的多樣性，新增了五種聲音風格，包括冷靜、熱情、才藝和開朗等，用戶可以根據不同場景選擇最合適的聲音。示例

OpenAI推出ChatGPT高級語音模式:新增五種聲音改善用戶體驗

OpenAI於本週二宣佈，將向更多付費客戶推出ChatGPT的高級語音模式（AVM）。這項升級旨在使對話更加自然流暢，首批受益用戶將是ChatGPT的Plus和Teams層級客戶。企業和教育客戶則將於下週開始獲得訪問權限。作爲此次更新的一部分，AVM的界面設計也進行了優化。用戶界面現在採用藍色動畫球體來代表該功能，取代了此前展示的動畫黑點。當AVM可供使用時，用戶將在ChatGPT應用程序中的語音圖標旁看到一個提示窗口。此次升級還爲用戶帶來了五種全新的聲音選擇:Arbor、Maple、Sol、Spruce和Vale。這使

訊飛星火API全新升級：Lite版永久免費 Max版可免費領1億Tokens

科大訊飛訊飛開放平臺宣佈訊飛星火API平臺實現重大升級，此次升級包括Spark Max模型和4.0Ultra模型，它們在生成速度上提升了70%，同時在邏輯推理、創作能力和聯網搜索等關鍵性能上實現了顯著突破。升級後的Spark Max和4.0Ultra模型在邏輯推理方面表現出更快的速度和更高的準確性，尤其在複雜任務處理上，能夠提供詳細的推理過程。在內容創作方面，新模型能夠生成具有邏輯性和實用性的文章，如小紅書文案等，同時在Function Call指令命中準確率上提升至90%以上。

百度與智源研究院達成戰略協議將在大模型等領域展開合作

北京百度網訊科技有限公司與北京智源人工智能研究院今日宣佈正式簽署戰略合作協議，雙方將在大模型等領域展開深度合作，共同構建人工智能產研協同生態。百度自2010年起開始全面佈局人工智能，是全球爲數不多的進行全棧佈局的人工智能公司，從崑崙芯、飛槳深度學習平臺、文心大模型到應用

AI大佬LeCun：AI 將很快與人類智能相媲美或超越人類智能

在最近的一次訪談中，Meta 首席人工智能科學家Yann LeCun表示，很快我們將擁有能夠爲個人提供人工智能助手的技術，即爲每個能上網的人創建一個個人數字助手團隊。作爲一名科學家，他專注於預測技術進步及其潛力，並強調我們將擁有與人類智能匹敵甚至超越人類智能的人工智能。圖源備註:圖片由AI生成，圖片授權服務商MidjourneyLeCun指出，未來我們與 AI 系統的交互將不再侷限於手機。他提到，未來的硬件很可能會是智能眼鏡，這種眼鏡可以代替我們完成許多日常任務，比如看、聽和記憶

中國科學技術大學出品！AI人像視頻編輯工具PortraitGen：風格化、換衣、修改光照通通搞定

相關推薦

​OpenAI推ChatGPT高級語音模式，新增五種聲音風格、免費用戶不可用

OpenAI推出ChatGPT高級語音模式:新增五種聲音改善用戶體驗

訊飛星火API全新升級：Lite版永久免費 Max版可免費領1億Tokens

百度與智源研究院達成戰略協議 將在大模型等領域展開合作

AI大佬LeCun：AI 將很快與人類智能相媲美或超越人類智能

OpenAI推ChatGPT高級語音模式，新增五種聲音風格、免費用戶不可用

百度與智源研究院達成戰略協議將在大模型等領域展開合作