歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、字節跳動EX-4D震撼開源:單目視頻秒變自由視角4D大片
EX-4D是字節跳動PICO-MR團隊推出的4D視頻生成框架,能夠從單目視頻生成高質量、多視角的4D視頻序列。該技術通過深度密閉網格(DW-Mesh)和輕量級適配架構,解決了傳統視頻生成技術在多視角生成中的挑戰,並在性能指標上全面領先。
【AiBase提要:】
💡 EX-4D利用深度密閉網格(DW-Mesh)實現單目視頻到多視角的高質量生成。
🔍 通過渲染mask和跟蹤mask策略,解決多視角數據稀缺問題。
🚀 在FID、FVD和VBench等指標上全面超越現有開源方法,性能表現卓越。
詳情鏈接:https://github.com/tau-yihouxiang/EX-4D
2、Bilibili開源動漫視頻生成模型AniSora V3版,一鍵生成多種風格動漫視頻鏡頭
Bilibili宣佈其開源動漫視頻生成模型AniSora V3迎來重大更新,顯著提升了生成質量、動作流暢度和風格多樣性。該版本基於CogVideoX-5B和Wan2.1-14B模型,結合強化學習與人類反饋(RLHF)框架,支持多種動漫風格的視頻生成,爲創作者提供了更強大的工具。
【AiBase提要:】
✨ AniSora V3通過時空掩碼模塊優化,增強了動畫任務的控制能力。
🚀 支持多任務處理,包括單幀圖像生成視頻、關鍵幀插值和脣部同步等功能。
📦 開源生態推動社區協作,開發者可通過GitHub獲取代碼和數據集。
詳情鏈接:https://t.co/I3HPKPvsBV
3、DeepSWE 開源 AI Agent系統強勢登頂,基於 Qwen3-32B
DeepSWE 是一款基於 Qwen3-32B 模型的開源 AI Agent 系統,通過強化學習進行訓練,並在 SWE-Bench-Verified 測試中取得了出色的性能表現。該系統採用 rLLM 框架和改進的 GRPO++ 算法,在軟件工程任務中展現出強大的學習能力與應用潛力。
【AiBase提要:】
🧠 DeepSWE 是基於 Qwen3-32B 模型,完全通過強化學習訓練而成,開源信息已全面發佈。
🏆 在 SWE-Bench-Verified 測試中,DeepSWE 表現出色,Pass@1準確率達到了59%,成爲所有開源代理中的佼佼者。
💡 採用了 rLLM 框架和改進的 GRPO++ 算法,DeepSWE 在實際軟件工程任務中展現了其強大的學習能力和應用潛力。
詳情鏈接:https://huggingface.co/agentica-org/DeepSWE-Preview
4、字節跳動開源新模型VINCIE-3B:3億參數,支持上下文連續圖像編輯
字節跳動開源了支持上下文連續圖像編輯的VINCIE-3B模型,該模型基於MM-DiT架構開發,能夠從視頻中學習並實現高效的圖像編輯。其技術亮點包括視頻驅動訓練、塊因果擴散變換器以及三重代理任務訓練,顯著提升了圖像編輯的質量和效率。
【AiBase提要:】
🎥 視頻驅動訓練:VINCIE-3B利用視頻的連續幀,自動提取文本描述與圖像序列,構建多模態訓練數據。
🧠 塊因果擴散變換器:模型採用塊因果注意力機制,在文本和圖像塊之間實現因果注意力,塊內則爲雙向注意力。
🔄 三重代理任務訓練:通過下一幀預測、當前幀分割預測和下一幀分割預測三種任務進行訓練,增強模型對動態場景和物體關係的理解能力。
詳情鏈接:https://huggingface.co/ByteDance-Seed/VINCIE-3B
5、Stability AI開源Stable Audio Open Small,手機秒變音頻創作神器
Stability AI與Arm合作推出Stable Audio Open Small,一款專爲移動設備優化的輕量級文本到音頻生成模型。該模型在移動端本地運行,支持離線處理,具備高效、低延遲和高質量輸出的特點,推動了AI音頻生成技術向邊緣計算和移動設備的轉型。
【AiBase提要:】
📱 輕量化設計:參數量壓縮至341M,適合移動端運行。
🔊 高質量音頻生成:支持立體聲音頻生成,無需雲端處理。
🌐 開源賦能開發者:遵循社區許可,降低技術門檻,鼓勵創意應用。
詳情鏈接:https://huggingface.co/stabilityai/stable-audio-open-small
6、谷歌重磅發佈Gemini for Education!免費AI工具席捲全球教育
谷歌推出全新AI工具套件Gemini for Education,基於最新一代Gemini2.5Pro模型和LearnLM學習型大模型,爲全球師生提供免費、強大且高效的學習與教學支持。該工具覆蓋30多種功能,支持40多種語言,旨在通過AI技術賦能教育工作者和學生,打造更加個性化和高效的學習體驗。
【AiBase提要:】
🌍 全球化教育賦能:支持40多種語言,覆蓋230多個國家和地區。
📚 免費開放:對所有Google Workspace for Education用戶完全免費,推動教育公平。
🔒 安全與隱私:嚴格遵循隱私條款,確保用戶數據安全。
7、Topview Avatar2震撼發佈!AI數字人革新電商帶貨,模特時代終結?
Topview Avatar2通過突破性的功能和逼真的效果,爲出海電商和內容創作者帶來了革命性的體驗。其創新的AI數字人技術能夠實現產品與數字人的自然交互,極大提升了視頻製作效率和內容質量。
【AiBase提要:】
🌍 全球首創AI數字人“穿戴”產品,實現更真實的交互效果。
⚙️ 一鍵生成定製化視頻,支持多語言口型同步,提升營銷靈活性。
🚀 革新傳統UGC視頻模式,降低電商拍攝門檻,助力品牌全球化。
詳情鏈接:https://www.topview.ai/ai-product-avatar
8、Perplexity推出Max訂閱計劃:每月200美元解鎖無限AI生產力
Perplexity推出了高端訂閱計劃Max,定價爲每月200美元或每年2000美元,旨在滿足高頻用戶和專業人士的需求。該計劃提供無限量訪問Labs、優先體驗新功能以及最新前沿模型的支持,標誌着其在AI生產力工具領域的進一步深耕。
【AiBase提要:】
🧠 無限Labs查詢:滿足專業用戶對深度研究和複雜項目的需求。
🚀 優先訪問前沿模型:確保用戶始終站在技術前沿。
🔒 優先支持:提供專用基礎設施和更快的客戶響應時間。
9、Cursor 大膽挖人!Claude Code 核心人物轉投競爭對手
Cursor 挖走 Anthropic 的兩位核心人物,標誌着 AI 編程市場競爭的加劇。儘管 Anthropic 面臨人才流失,但其業務依然強勁,收入和估值顯著增長。Anysphere 則藉助這些人才進一步提升產品競爭力。
【AiBase提要:】
🧠 Cursor 成功挖走 Anthropic 核心人物,技術實力增強
💼 Boris Cherny 和 Cat Wu 加入 Anysphere,推動產品創新
📈 Anthropic 業務增長迅速,收入和估值均大幅提升
10、OpenAI 聲明:Robinh ood 推出的 “OpenAI 代 幣” 與我們無關
文章指出,Robinh ood 在歐洲推出了 OpenAI 和 SpaceX 的代 幣化股票,但 OpenAI 明確表示這些代幣並非其股權,且與 Robinh ood 沒有合作關係。儘管 Robinh ood 提供了限時優惠吸引用戶,但美國用戶無法參與。這一事件引發了市場的熱烈反響,Robinh ood 股價一度飆升。
【AiBase提要:】
💰 OpenAI 強調“OpenAI 代 幣”不是其股權,與 Robinh ood 無合作。
⚠️ Robinh ood 通過代 幣化股票吸引投資者,但美國用戶無法參與。
📈 Robinh ood 股價因該消息上漲,創下歷史新高。