歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、騰訊重磅發佈混元3D 3.0模型 建模精度提升3倍

騰訊在2025全球數字生態大會上重磅發佈混元3D 3.0模型,其3D-DiT分級雕刻技術顯著提升了建模精度,同時推出混元3D Studio平臺和開源計劃,推動3D創作的邊界拓展。

【AiBase提要:】

🧠 混元3D 3.0模型採用3D-DiT分級雕刻技術,建模精度提升3倍。

🎨 混元3D Studio平臺提供專業創作工具,提升3D藝術創作效率和質量。

🚀 騰訊計劃開源混元3D omni模型,加速3D生成技術在學術與工業應用中的落地。

2、崑崙萬維AI 音樂創作平臺Mureka上線Agent Studio功能,讓音樂創作變得觸手可及!

Mureka 的「Agent Studio」功能通過直觀的方式讓音樂創作變得觸手可及,用戶只需簡單描述想法,AI 就能自動生成歌詞和音樂。該功能包含多個創作場景,如專輯製作、熱點寫歌等,爲用戶提供多樣化的音樂體驗。

image.png

【AiBase提要:】

🎧 Mureka 推出「Agent Studio」功能,讓普通人也能輕鬆進行音樂創作。

🤖 用戶只需說出簡單想法,AI 即可生成完整的歌詞和音樂。

🎶 目前已有六個創作場景,涵蓋專輯製作、熱點寫歌、情感表達等多種功能。

3、阿里Qoder推出付費訂閱服務,Pro版每月20美元,助力AI自主編程

Qoder正式推出付費訂閱計劃,提供Pro和Pro+版本,支持無限代碼補全、高級模型調用等功能,提升開發效率。同時優化了Credits消耗問題,提高智能體工具的並行化能力和工程檢索準確率。

image.png

【AiBase提要:】

🔥 Qoder推出付費訂閱服務,支持Pro和Pro+版本,滿足開發者高效編程需求。

💡 Pro版提供無限代碼補全和2000 Credits,Pro+版則提供6000 Credits和更多資源。

🚀 優化Credits消耗,提升智能體工具的並行化能力,降低token消耗。

4、VEED Fabric 1.0發佈!一張圖片變身“會說話”視頻

VEED推出的Fabric 1.0是一款革命性的AI視頻生成工具,能夠通過一張圖片和語音輸入生成高質量的會說話視頻。該工具在脣形同步、面部表情自然度以及生成速度方面表現出色,顯著降低了視頻製作的成本和時間,適用於多種內容創作場景。

【AiBase提要:】

🖼️ Fabric 1.0支持從靜態圖像生成生動的會說話視頻,實現動態敘事。

⏱️ 視頻生成速度提升7倍,成本降低60倍,適合快速內容生產。

🌐 集成多語言支持與自動字幕功能,增強全球用戶使用體驗。

詳情鏈接:https://www.veed.io/ai/fabric-1-0

5、OpenAI重磅推出GPT-5-Codex:AI編碼代理將徹底顛覆開發者世界

OpenAI發佈GPT-5-Codex,標誌着AI在代理式編碼領域的重大突破,其動態思考機制和多平臺集成能力顯著提升了軟件開發效率。

image.png

【AiBase提要:】

🧠 GPT-5-Codex具備動態思考機制,能根據任務複雜度調整處理時間,提升編碼效率。

💻 支持多平臺集成,包括IDE擴展、Web界面和GitHub代碼審查功能,增強開發者生態。

🚀 開發者反饋顯示,GPT-5-Codex顯著縮短開發週期,提升代碼生成速度並減少錯誤註釋。

詳情鏈接:https://openai.com/index/introducing-upgrades-to-codex/

6、全國發布《人工智能安全治理框架》2.0版,推動安全可信的 AI 生態建設

《人工智能安全治理框架》2.0版於2025年9月15日正式發佈,旨在應對快速發展的AI技術帶來的新挑戰。該框架在1.0版基礎上進行了優化,結合實際應用情況,完善了風險分類和防範措施,並強調了全球合作的重要性。

image.png

【AiBase提要:】

🔐 《人工智能安全治理框架》2.0版正式發佈,以應對AI技術發展帶來的新挑戰。

🔍 框架基於1.0版進行優化,完善了風險分類與防範措施。

🤝 強調全球合作,推動多邊機制下的人工智能安全治理合作。

詳情鏈接:https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm

7、OpenAI Evals新增原生音頻輸入和評估功能

OpenAI 的 Evals 工具新增原生音頻輸入和評估功能,使開發者能夠直接上傳音頻文件進行性能評估,從而大幅提升語音識別與生成模型的開發效率和準確性。

【AiBase提要:】

🎧 原生音頻輸入功能簡化了評估流程,提升開發效率。

🔍 無需文本轉錄即可直接評估語音識別與生成模型性能。

💡 新功能爲智能語音助手和音頻內容生成提供更精準的測試支持。

8、顛覆傳統!Mini-o3 開源模型實現超長視覺推理,深度思考不再是難題

Mini-o3是字節跳動與香港大學聯合推出的開源視覺推理模型,能夠進行數十輪的視覺推理,顯著提升了處理複雜視覺問題的能力。其核心設計包括VisualProbe數據集、迭代數據收集流程和超輪次掩碼策略,爲多輪視覺推理技術提供了新的方向。

image.png

【AiBase提要:】

🧠 Mini-o3實現了數十輪的視覺推理能力,突破了以往1-2輪對話的限制。

📊 通過構建VisualProbe數據集和迭代數據收集流程,提升了模型的深度推理能力。

🔄 超輪次掩碼策略優化了訓練效率,使模型在測試階段表現更出色。

詳情鏈接:https://arxiv.org/pdf/2509.07969

9、上海AI Lab推出Lumina-DiMOO,開創多模態生成與理解新局面

上海人工智能實驗室聯合多所高校推出了新一代多模態生成與理解模型Lumina-DiMOO。該模型採用創新的全離散擴散架構,通過對比學習技術實現文本、圖像和音頻等數據的有效整合與對齊,顯著提升了生成質量和效率,並在多種應用場景中展現出廣闊的應用潛力。

image.png

【AiBase提要:】

🌟 Lumina-DiMOO 是新一代多模態生成模型,採用創新的“全離散擴散架構”以提升數據處理效率。

🛠️ 該模型通過對比學習技術,實現了文本、圖像等多種數據的有效對齊與理解。

🚀 Lumina-DiMOO 在圖像生成和理解方面表現卓越,能夠適應多種應用場景,展現出廣闊的應用潛力。

詳情鏈接:https://github.com/Alpha-VLLM/Lumina-DiMOO

10、騰訊全新AI繪畫升級!微調技術讓生成圖像美感提升300%

騰訊推出的微調技術顯著提升了AI生成圖像的真實感與美學評分,其創新方法包括“Direct-Align”和“語義相對偏好優化”,有效解決了獎勵作弊和離線調整限制的問題。

image.png

【AiBase提要:】

🧠 通過“Direct-Align”技術減少梯度爆炸,提升模型優化能力。

🎨 “語義相對偏好優化”(SRPO)實現文本控制圖像風格調整。

📈 實驗顯示SRPO訓練模型在真實感和美學質量上顯著提升。

詳情鏈接:https://arxiv.org/pdf/2509.06942

11、Meta AI 發佈 MobileLLM-R1:輕量級邊緣推理模型,參數不足 10 億,性能提升顯著

Meta AI 推出的 MobileLLM-R1 系列模型在輕量化和邊緣計算領域表現出色,其參數規模從140M到950M,專注於數學、編碼和科學推理。該模型在訓練效率和性能上均優於同類模型,尤其在數學和編碼任務中表現突出。

image.png

【AiBase提要:】

🧩 新模型發佈:Meta AI 推出 MobileLLM-R1 系列輕量級邊緣推理模型,參數範圍從140M 到950M。

📊 訓練效率:MobileLLM-R1 僅用約11.7% 的數據訓練,表現出色,訓練成本和資源需求顯著降低。

💡 性能優勢:在多項基準測試中,MobileLLM-R1-950M 表現超越多款大型開源模型,尤其在數學和編碼任務上。

詳情鏈接:https://huggingface.co/facebook/MobileLLM-R1-950M

12、騰訊啓動AI應用繁榮計劃,超300家企業搶灘智能體新賽道

騰訊全球數字生態大會發布AI應用繁榮計劃,聚焦垂直場景,推動AI產業深度滲透。該計劃涵蓋AI共創營和AI百校行,吸引超300家企業參與,並通過技術共享、資源開放等方式孵化智能體與大模型應用。

image.png

【AiBase提要:】

🌐騰訊人工智能應用繁榮計劃旨在將人工智能深度融入垂直場景,有兩個核心模塊:人工智能共創營和人工智能百所學校活動。

🌐首屆線下活動吸引了來自多個行業的近 3000 名參與者,顯示了大規模人工智能應用的強勁市場需求。

🌐騰訊提供技術支持、資源和內容,幫助合作伙伴將其人工智能解決方案商業化。


13、谷歌DeepMind 發佈 VaultGemma 具備差分隱私能力

谷歌 DeepMind 推出的 VaultGemma 是一款具有差分隱私能力的語言模型,專注於保護用戶數據隱私。它基於 Gemma2 架構,採用了多查詢注意力機制,並通過添加隨機噪聲確保模型輸出無法與特定訓練樣本關聯。儘管性能略顯保守,但 VaultGemma 在隱私保護方面提供了更強的保障,未來有望爲用戶提供更安全和可靠的使用體驗。

【AiBase提要:】

🔒 VaultGemma 是一款具備差分隱私能力的開源語言模型,參數規模達到10億。

🧠 採用僅解碼器的 Transformer 設計,序列長度限制爲1024個 Token。

🌐 谷歌將在 Hugging Face 和 Kaggle 上公開 VaultGemma 及其代碼庫,推動隱私安全與開源技術的結合。

14、QuestMobile 數據:豆包月活超越DeepSeek,榮登中國原生 AI APP 榜首

QuestMobile發佈的2025年8月AI應用行業月度報告顯示,豆包憑藉6.6%的環比增速達到1.57億月活用戶,超越DeepSeek成爲原生應用的第一。騰訊元寶同樣表現不俗,其月活增速高達22.4%,位居原生應用第三。此外,超過一半的TOP50 AI 應用爲In-App插件應用,豆包作爲一款PC客戶端應用也成功躋身榜單,顯示出其跨端使用的優勢。

image.png

【AiBase提要:】

📱 豆包以6.6%的環比增速達到1.57億月活用戶,超越DeepSeek成爲原生應用第一

💻 騰訊元寶月活增速達22.4%,位列原生應用第三,用戶規模在1000萬到1億之間

🔄 超過一半的TOP50 AI 應用爲In-App插件應用,豆包作爲PC客戶端成功躋身榜單