正文

新對口型視頻項目Hallo發佈可對錶情，嘴型進行精確控制

aibase

發布於AI新閒資訊

時間 :Jun 17, 2024

閱讀 :1分鐘

站長之家(ChinaZ.com) 6月17日消息:Hallo允許通過單張圖像和音頻輸入生成唱歌和說話的視頻，同時還能控制視頻中人物的表情和姿態。這項技術基於擴散模型的層次化音頻驅動視覺合成方法，旨在提升語音輸入與生成動畫之間的對齊精度，包括嘴脣、表情和姿態的同步。

主要功能:

虛擬角色動畫生成:通過語音音頻輸入，生成逼真、動態的虛擬角色動畫，並實現口型、表情和姿態的精確同步。
真實角色動畫生成:將該技術應用於真實人物，生成的動畫能準確反映真實人物的表情和動作變化。
多種運動控制:提供對角色表情、姿態和嘴脣運動的精確控制，支持多種表情和姿態的自適應控制，以增強動畫的多樣性和真實性。
跨演員應用:支持不同身份的個性化動畫生成，通過音頻輸入，生成適應不同角色身份的動畫效果。
歌唱動畫生成:通過語音和歌曲音頻輸入，生成同步的歌唱動畫，動畫能夠準確反映歌唱時的口型和表情變化。

這項技術通過輸入語音來生成人物嘴脣同步、表情變化和姿態變化的動畫，提高語音與生成動畫之間的對齊精度，使動畫的嘴脣、表情和姿態與語音更匹配。採用的先進技術和結構增強了動畫生成的實時性和視覺效果，使生成的動畫更加逼真和自然。

這項研究的成果不僅在學術上具有創新性，而且在實際應用中也展現出巨大的潛力，如在娛樂、教育、虛擬助手和其他多媒體領域的應用。通過這項技術，用戶可以更直觀、更生動地與虛擬角色進行交互，享受更加豐富和真實的體驗。

項目地址：https://top.aibase.com/tool/hallo

相關推薦

千問打車新玩法：各地文旅“整活兒”推薦，網友一試居然真能到

各地文旅部門藉助千問AI打車功能，推出創意目的地文案，如甘肅的“空城計”地點、山西的“小西天”等，融合美食、遊戲、影視元素，引發網友熱議並登上熱搜。

邁巴赫也刷“智商”了！奔馳攜手清華、智譜，大模型首進超豪華後排

奔馳與清華、智譜AI合作，將多模態大模型應用於新一代邁巴赫S級後排娛樂系統，成爲全球首個在後排引入該技術的汽車品牌，重新定義豪華出行交互體驗。

WebinarTV 被曝祕密將 Zoom 錄製件轉化爲 AI 播客

一家平臺被曝利用自動化工具抓取公開Zoom會議鏈接，未經許可將私人或商務通話錄製件轉化爲“AI播客”內容，涉嫌侵犯隱私與版權，引發對內容自動化過程中法律與道德風險的關注。

單季狂撒 40 億！快手 Q4 財報亮眼：AIGC 營銷素材消耗佔大頭，AI 徹底重塑商業鏈路

快手2025年Q4財報顯示，線上營銷收入達236億元，同比增長14.5%。AI技術成爲商業化核心驅動力，其中AIGC生成的內容素材單季消耗已達40億元，凸顯AI與短視頻商業化的深度融合。

Claude Code Auto Mode 重磅上線！AI 終於“自己開車”了，徹底告別每一步手動確認

Anthropic旗下Claude Code推出Auto Mode模式，可自主判斷代碼操作安全性。安全操作直接執行，風險操作自動攔截並詢問用戶，終結了以往每一步手動確認的繁瑣體驗。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase