歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、生數科技推出 Vidu Q2,細微表情生成讓AI演繹更真實!
生數科技推出的Vidu Q2模型在圖生視頻領域實現了重大突破,尤其在細微表情生成方面表現出色,爲AI演繹提供了更加真實和生動的視覺體驗。
【AiBase提要:】
🎭 Vidu Q2能夠精準捕捉細微表情變化,提升視頻生成的自然度和情感表達。
🎥 支持多種視頻模式選擇,包括圖生視頻、首尾幀視頻以及可調時長選項,滿足多樣化需求。
💡 生數科技致力於通過AI技術推動創意產業發展,爲用戶帶來更高質量的影像創作體驗。
2、火山引擎推出爐米 Lumi 平臺 支持視覺模型 Lora 微調
火山引擎推出的爐米 Lumi 平臺,首次支持豆包、即夢等同款視覺模型的 Lora 微調功能,旨在幫助企業高效定製獨特的視覺風格,滿足市場需求。
【AiBase提要:】
🧠 爐米 Lumi 平臺支持視覺模型的 Lora 微調功能,幫助企業定製獨特的視覺風格。
🚀 該平臺提供從圖片生成到視頻生成的全流程服務,滿足企業專業場景的 AIGC 需求。
💡 爐米 Lumi 平臺助力企業高效構建定製化 AIGC 生產能力,提升用戶體驗。
3、阿里雲CTO透露:通義千問開源300+模型 下載量破6億大關
阿里雲在2025雲棲大會上展示了通義千問項目的顯著成就,包括開源超過300個模型和下載量突破6億次。這表明了阿里雲在AI領域的強大影響力和技術實力,並且通過開源模型推動技術創新和應用落地。
【AiBase提要:】
🚀 通義千問項目已開源300多個模型,展示出強大的技術實力。
📊 下載總量突破6億次,體現了用戶對阿里雲AI技術的高度認可。
🖼️ 通義萬象生成超3.9億張圖片和7000多萬視頻,彰顯數字內容生成能力。
4、百度 Qianfan-VL 開源發佈,崑崙芯助力多模態 AI 新突破
百度正式開源了其最新視覺理解模型 Qianfan-VL,包含3B、8B和70B三個版本,適用於不同場景。該模型具備強大的多模態能力,尤其在OCR和教育領域表現突出,並且訓練依賴於自研的崑崙芯P800芯片。
【AiBase提要:】
🧠 Qianfan-VL 是一個強大的多模態大模型,能夠同時處理圖像和文本信息。
💡 崑崙芯 P800 芯片支撐模型訓練,功耗低且效率高,優化大規模計算性能。
🚀 Qianfan-VL 系列已在 GitHub 和 Hugging Face 上開源,供開發者自由使用。
詳情鏈接:https://github.com/baidubce/Qianfan-VL
5、微軟引入 Anthropic AI 模型,拓展 Copilot Assistant 功能
微軟宣佈在 Copilot 助手中引入 Anthropic 的 AI 模型,標誌着其在生成式人工智能領域的多元化戰略邁出新一步。儘管與 OpenAI 的合作依然密切,微軟開始引入 Anthropic 的技術以滿足商業客戶的需求。企業用戶現在可以使用 Anthropic 的模型構建 AI 代理,並且這些模型將在亞馬遜和谷歌雲中運行。
【AiBase提要:】
🤖 微軟在 Copilot 助手中引入 Anthropic 的 AI 模型,推動產品多元化。
🔄 Microsoft 與 OpenAI 的關係雖然仍然緊密,但逐漸使用 Anthropic 技術。
🚀 企業用戶可選擇 Anthropic 模型構建 AI 代理,需管理員啓用後使用。
6、OpenAI 在美國新建五個數據中心,推動 Stargate 項目快速發展
OpenAI 宣佈將在美國新建五個數據中心,以提升 Stargate 項目的計算能力。該項目由多家公司共同發起,總投資額高達5000億美元,旨在推動生成式人工智能的發展。
【AiBase提要:】
🌐 OpenAI 將在美國新建五個數據中心,Stargate 項目總計算能力將達到近7GW。
💼 Oracle 將負責三個新數據中心的建設,阿比林數據中心將擴建並增加600MW 計算能力。
🚀 OpenAI 計劃未來每週增加1GW 的人工智能基礎設施,以推動 AI 技術的進一步發展。
7、英偉達開源 Audio2Face 模型,AI 助力實時面部動畫生成
英偉達開源了其生成式 AI 面部動畫模型 Audio2Face,提供了 SDK 和訓練框架,支持離線和實時處理,適用於遊戲、影視等多個領域。該技術已被多家遊戲開發商採用,提升了角色的真實感和沉浸體驗。
【AiBase提要:】
🔊 英偉達開源 Audio2Face 模型,提升虛擬角色的面部動畫生成技術。
🎮 支持離線渲染和實時流式處理,適用於多種場景。
🌟 已被多個遊戲開發商採用,簡化製作流程並提升角色真實感。
詳情鏈接:https://build.nvidia.com/nvidia/audio2face-3d
8、Meta 發佈代碼世界模型 CWM:具備沙箱推演能力的32B AI
Meta 推出的 Code World Model (CWM) 是一個擁有 32B 參數 的 AI 系統,能夠通過沙箱環境進行代碼模擬和推演,從而減少錯誤並提高調試效率。該模型對硬件要求極高,需要雙 H100 GPU 和 RDMA 技術支持。
【AiBase提要:】
🧠 CWM 在生成代碼前會進行沙箱模擬,預測代碼運行後果。
🔍 能快速定位代碼錯誤,提升調試效率。
🚨 可在執行命令前預警潛在風險,增強安全性。
詳情鏈接:https://github.com/facebookresearch/cwm