字節跳動推出 OmniHuman-1：讓一張照片變成會說話生動的虛擬人

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 16, 2025

想象一下，僅憑一張照片，就能在幾秒鐘內看到這個人說話、做動作，甚至進行表演，這就是字節跳動推出的 OmniHuman-1的魅力所在。這款近期在網上走紅的人工智能模型，可以通過生成高度逼真的視頻，使靜態圖像煥發活力，配合音頻片段，實現口型同步、全身肢體動作和豐富的面部表情。

與傳統的深度僞造技術不同，OmniHuman-1不僅僅侷限於人臉替換，而是能夠完整地動畫化整個身軀，包括自然的手勢、姿態，以及與物體的互動。無論是一個政客在發表演講、一個歷史人物被複活，還是一個虛擬角色在唱歌，該模型正在促使我們重新思考視頻創作的方式。

OmniHuman-1的亮點在於其出色的逼真度和功能性。它不僅可以動畫化人臉，還能提供令人印象深刻的口型同步和細膩的情感表達。無論是高分辨率的肖像照，還是低質量的快照，甚至是風格化的插圖，OmniHuman-1都能夠智能適應，實現流暢而可信的動態效果。

該技術的核心在於其創新的 “全條件” 訓練策略，使用多種輸入信號（如音頻片段、文本提示和姿態參考）同時進行訓練，使 AI 能夠更準確地預測動作，特別是在涉及複雜的手勢和情感表達時。字節跳動還利用了一個龐大的18700小時的人類視頻數據集，極大地提升了生成內容的自然感。

然而，OmniHuman-1的出現也帶來了諸多倫理和安全問題。例如，其高度真實的生成能力可能會被用於傳播虛假信息、身份盜竊和數字僞裝。此外，字節跳動在推出該技術時，必須採取強有力的監管措施，比如數字水印和內容真實性追蹤，以防止濫用。各國政府和科技組織正在努力制定監管政策，以應對這一迅速發展的領域。

未來，OmniHuman-1在社交媒體、電影、遊戲和虛擬影響力方面都有巨大的應用潛力。字節跳動的這一創新不僅推動了 AI 生成技術的發展，也在全球科技競爭中增添了新的變數。

項目：https://omnihuman-lab.github.io/

劃重點:
🌟 OmniHuman-1是字節跳動推出的 AI 模型，可以將一張照片轉化爲生動的動態視頻。
🤖 該模型動畫化的是整個人體，而不僅僅是人臉，具有自然的動作和情感表達。
🔒 由於其可能帶來的深度僞造風險，字節跳動在推出時需採取嚴格的監管措施。

OPPO AI接入DeepSeek-R1 旗下Find N5將於2月20發佈

OPPO今日宣佈，其最新款摺疊屏手機Find N5將於2月20日19:00正式發佈。這款手機號稱全球最薄摺疊屏，單邊厚度僅約4mm，摺疊狀態厚度不到9.2mm。除了擁有極致的輕薄設計，Find N5還搭載了高通驍龍8至尊版芯片，並配備了3D打印鈦合金鉸鏈，是全球唯一同時支持IPX6、IPX8、IPX9滿級防水的摺疊旗艦手機。

AI先鋒李飛飛呼籲政策制定者不要讓科幻情節左右AI規則

在近日於巴黎大皇宮舉行的人工智能行動峯會上，斯坦福大學的研究員、世界實驗室創始人李飛飛發表了開幕演講。她的演講引起了廣泛關注，內容涉及對人工智能的監管、商業生態以及社會的深遠影響。李飛飛在演講中強調，人工智能的未來應建立在科學基礎之上，而不是誇大其詞的科幻情節。李飛飛呼籲各國投資更加健康和多元的人工智能生態系統，認爲學術界和公衆社區在這一過程中應發揮至關重要的作用。她指出:“如果這些資源僅集中在少數幾家公司手中，人工智能生態系統將面

谷歌支持的公共利益AI合作伙伴關係啓動，籌集超過4億美元資金

在法國人工智能行動峯會上，一個名爲 Current AI 的公共利益倡議正式宣佈啓動，旨在促進和引導人工智能的開發，確保其朝着有利於社會的方向發展。該倡議首次籌集了超過4億美元的資金，並計劃在未來五年內再募集25億美元。圖源備註：圖片由AI生成，圖片授權服務商Midjourney儘管這一金額相較於其他 AI 投資可能顯得不算大，例如法國總統近期提到的約1120億美元的私人支持計劃，或美國5000億美元的投資，Current AI 的支持者認爲，這些資金足以在醫療和氣候目標等關鍵領域產生重要影響。

知乎AI搜索產品知乎直答接入“滿血版”DeepSeek-R1

據悉，DeepSeek-R1模型具備出色的邏輯推演與結構化輸出能力，在文字生成場景中表現出色。而知乎直答則擁有社區內龐大的優質語料和超過5000萬篇中英文文獻數據，具有強大的專業內容搜索和溯源能力。此次兩者的結合，將爲AI搜索產品帶來一次重大革新。

ZyphraAI 開源 Zonos-TTS:支持實時語音克隆和多語言情感控制

ZyphraAI 近日發佈了其最新的多語言文本到語音（TTS）模型 **Zonos-TTS**，該模型基於 **Apache2.0許可證**，完全開源且可商用。Zonos-TTS 不僅支持實時語音克隆功能，還經過20萬小時的英語語音數據訓練，表現出卓越的性能。Zonos-TTS 提供了兩種部署方式:支持本地部署和便捷的 API 服務。對於普通用戶，ZyphraAI 提供每月免費生成 **100分鐘** 音頻的服務;專業版用戶則可以選擇 **300分鐘/5美元** 的套餐，超出部分按每分鐘 **0.02美元** 計費。特別值得一提的是，實時語音克隆功能完全免費，且支持高音頻

谷歌擴展NotebookLM Plus，個人用戶也能享受AI記筆記新體驗

谷歌最近宣佈，NotebookLM Plus 的付費版本現已向訂閱谷歌 One AI Premium 計劃的個人用戶開放。這一消息的發佈距 NotebookLM Plus 在谷歌雲和谷歌工作區首次推出企業版不到兩個月，顯示出谷歌對個人用戶需求的重視。NotebookLM Plus 於去年12月首次推出，作爲一款 AI 驅動的筆記和研究助手，旨在爲用戶提供更高的使用限制和更多的高級功能。與免費版相比，NotebookLM Plus 的用戶每天可以使用五倍的資源，允許創建多達500本筆記，每本筆記最多可包含300個來源，此外，每天還可以進行500次聊天查詢和20

​字節跳動推出 OmniHuman-1：讓一張照片變成會說話生動的虛擬人

相關AI新聞推薦