歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、可靈AI平臺1.5模型升級:上線人臉模型功能 新增「標準模式」
可靈 AI 平臺最近升級至1.5版本,推出多項新功能,包括增強的高品質視頻生成模式和新增的標準模式,後者支持快速生成720p 視頻。新的人臉模型功能面向高級會員開放,用戶可在訓練後隨時生成視頻。
【AiBase提要:】
🎨 高品質模式增強,用戶可指定運動軌跡,添加靜止區域,提供更精細的控制。
⚡ 新增標準模式,快速生成720p視頻,創作時間大幅縮短,性價比高。
👤 人臉模型功能面向會員開放,解決人臉ID保持難題,支持隨時調用生成視頻。
2、Runway新增視頻擴展畫面功能“Expand Video”
Runway 近日推出 “Expand Video” 功能,用戶可通過文本提示在原視頻基礎上生成額外視覺內容,並調整視頻。該功能支持動態效果,如快速變焦和拉遠鏡頭,使視頻更加生動。此工具標着視頻生成技術的又一進步,進一步豐富創作可能性。
【AiBase提要:】
🎥 新功能上線: RunwayML推出“Expand Video”,允許用戶通過文本提示在原視頻基礎上擴展內容。
⚙️ 動態效果實現: 用戶可以創造快速變焦和拉遠鏡頭等動態效果,提升視頻的視覺體驗。
🚀 生成速度提升: 新一代Gen-3Alpha模型生成速度顯著提高,滿足用戶快速創作的需求。
3、華爲Mate70系列將支持AI隔空傳送 餘承東親自演示
華爲 Mate70系列即將發佈,搭載 AI 隔空傳送和魔法手勢操作功能。用戶可通過手勢輕鬆傳送內容,提升使用體驗。此外,Mate70系列將首次搭載原生鴻蒙系統,標誌着華爲在移動操作系統領域的進展。
【AiBase提要:】
🤖 AI隔空傳送:用戶可通過簡單手勢將內容從Mate70手機傳送至平板,操作便捷。
✋ 魔法手勢操作:在不便用手時,用戶可通過手勢翻頁等操作,增加靈活性。
🌐 原生鴻蒙系統:Mate70系列首次搭載原生鴻蒙系統,標誌着中國在移動操作系統領域的進步。
4、Lightricks開源實時視頻生成模型LTX-Video 生成一個視頻只要4秒!
Lightricks 推出了名爲 LTX Video 的開源視頻生成模型,具有20億參數。該模型可以以每秒24幀的速度生成高達5秒的視頻,僅需4秒,性能顯著。LTXV 與 ComfyUI 無縫集成,提升用戶體驗,促進創意產業的發展。
【AiBase提要:】
🚀 LTXV模型基於擴散變換器架構,擁有20億參數,生成速度快於視頻播放,4秒生成5秒視頻。
💻 採用bfloat16精度,在主流顯卡上高效運行,優化內存使用,確保視頻質量。
🌍 LTXV與ComfyUI無縫集成,降低使用門檻,推動創意科技的民主化,爲創作者提供無限可能。
詳情鏈接:https://www.lightricks.com/ltxv
5、EchoMimicV2:輸入圖片、音頻和手勢視頻即可生成“同款”數字人
EchoMimicV2是最新的動畫生成技術,支持輸入一張圖、一段手勢視頻和一段音頻,能夠生成高質量的半身人類動畫該技術通過 Audio-Pose Dynamic Harmonization 策略提升動畫細節,簡化生成過程,並引入頭部局部注意力機制來解決數據稀缺問題。
【AiBase提要:】
✨ EchoMimicV2通過簡化控制條件,實現高質量的半身人類動畫生成。
🎨 採用 Audio-Pose Dynamic Harmonization 策略,提升動畫細節與表現力。
📊 新基準評估方法顯示,EchoMimicV2在效果上優於現有技術。
6、音頻驅動生成面部視頻技術JoyVASA
JoyVASA 是一種新興的音頻驅動圖像動畫技術,旨在提升視頻質量和嘴形同步精度。其創新的兩階段設計使得生成更長的動畫視頻成爲可能,同時支持人物和動物的動畫化,展現出良好的多語言支持能力。
【AiBase提要:】
🎨 JoyVASA 技術通過解耦面部表情與三維模型,實現更長的動畫視頻生成。
🔊 該技術能夠根據音頻線索生成動作序列,具有人物與動物動畫的雙重能力。
🌐 JoyVASA 在中英文數據集上訓練,具備多語言支持,爲全球用戶提供服務。
詳情鏈接:https://jdh-algo.github.io/JoyVASA/
7、PicMenu:用AI將菜單可視化 隨手一拍就能生成高質量菜單
PicMenu 是一款創新的 AI 菜單可視化工具,通過簡單的拍照操作,將傳統紙質菜單轉化爲生動直觀的數字化展示。它爲餐飲行業的數字化轉型提供了全新解決方案,展現出極強的實用性和技術實力。
【AiBase提要:】
📸 PicMenu 能通過拍照自動識別並提取菜品信息,生成高質量的數字化菜單展示。
🌍 該工具採用多重 AI 技術棧,確保菜品信息提取和圖像生成的高效性與準確性。
🔧 項目開源,開發者可通過 GitHub 獲取源代碼,便於個性化定製和部署。
詳情鏈接:https://www.picmenu.co/
8、英偉達發佈Edify3D生成模型2分鐘即可生成高質量3D資產
NVIDIA 推出的 Edify3D 技術能夠在兩分鐘內,根據文本描述或參考圖像生成高質量的3D 模型,具備完整的 UV 貼圖、4K 紋理和 PBR 材質。該技術結合了多視角擴散模型和基於 Transformer 的重建技術,顯著提高了3D 資產的創作效率,支持多樣化的應用場景。
【AiBase提要:】
🎨 Edify3D技術能在兩分鐘內生成高質量3D模型,支持完整UV貼圖和4K紋理,適用於多種行業。
🔍 該技術結合了多視角擴散模型和Transformer重建技術,確保生成的模型具有精確的網格結構和高分辨率紋理。
🌐 Edify3D還支持根據文本提示生成複雜3D場景,提供了強大的藝術設計和3D建模支持。
詳情鏈接:https://research.nvidia.com/labs/dir/edify-3d/
9、更聰明瞭!小米智能家庭屏系列產品推送大模型超級小愛
小米公司宣佈對智能家庭屏系列產品進行大模型升級,增加超級問答和閒聊對話等新功能。此次升級覆蓋六款設備,用戶需通過小愛音箱 App 完成設置。升級後,音箱將支持文本創作,具備更全面的知識庫,提升用戶體驗。
【AiBase提要:】
🔧 升級覆蓋六款設備,包括Xiaomi智能家庭屏10和小米小愛觸屏音箱Pro8等。
📱 用戶需將音箱升級到最新版本,並在App中設置大模型功能。
🌐 新功能支持文本創作和實時搜索,用戶可直接向音箱詢問各種問題。
10、REDMI K80Pro搭載Xiaomi AISP2.0影像算法:融合四大模型
小米公司今日披露了REDMI K80系列手機的影像配置細節,標誌着該系列在攝影能力上的全面提升。Xiaomi AISP2.0包含了融合光學大模型2.0、影調大模型2.0、色彩大模型2.0以及人像大模型2.0,這些技術的應用將進一步提升K80Pro的影像處理能力。
【AiBase提要:】
📷 REDMI K80系列搭載旗艦級高動態主攝和浮動長焦鏡頭,滿足高質量攝影需求。
⚙️ K80Pro內置Xiaomi AISP2.0技術,支持150張全算法高畫質快拍,提升拍攝體驗。
💰 標準版與Pro版在主攝和體驗上保持一致,但不含高成本浮動長焦鏡頭,提供更具性價比的選擇。
11、胖東來發聲明:警告多賬號擅自利用AI生成於東來聲音
胖東來商貿集團近日發佈聲明,警告多個賬號未經授權使用其創始人於東來聲音,並篡改視頻內容。這些行爲嚴重侵犯了公司的著作權和人格權,誤導公衆,影響品牌形象。胖東來表示將採取法律措施追究責任,以維護其合法權益和網絡生態的正常秩序。
【AiBase提要:】
🔊 多個賬號利用AI生成與於東來相似的聲音,進行非法剪輯和篡改。
⚖️ 胖東來強調此行爲侵犯著作權,並製造虛假信息,破壞網絡生態。
🚫 公司要求相關賬號立即停止侵權,並表示將採取法律行動。
12、2028年全球生成式AI芯片市場預計將達862.4億美元
根據最新報告,生成式人工智能芯片市場正在經歷快速增長,預計到2028年市場規模將達到862.4億美元。這一增長反映了對計算能力的需求激增和雲計算的普及。
【AiBase提要:】
🌟 市場規模預計到2028年將達862.4億美元,年均增長率爲27.9%。
💻 主要驅動因素包括計算能力需求增加、深度學習發展及雲計算普及。
📈 高通推出新一代芯片,提升智能手機生成式AI能力,推動市場創新。