歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、視頻生成可控性再升級!可靈2.5Turbo模型上線“首尾幀”功能
可靈2.5Turbo模型的推出,顯著提升了AI視頻生成的可控性、穩定性與一致性,爲專業創意內容生產提供了更優質的解決方案。其在動態效果、文本響應精度、風格保持能力以及整體美學效果方面均有明顯提升,並引入了全新的首尾幀功能,使創作者能夠更精準地控制視頻的起點和終點狀態。
【AiBase提要:】
🚀 可靈2.5Turbo模型顯著提升了AI視頻生成的可控性和穩定性。
🎨 在動態效果、文本響應精度和風格保持能力上實現突破。
📽️ 新增首尾幀功能,幫助創作者精準控制視頻的起點和終點狀態。
2、百度發佈全新原生全模態大模型文心5.0
百度在2025年11月13日的百度世界大會上正式推出了最新原生全模態大模型——文心5.0。該模型擁有2.4萬億參數量,並採用了原生全模態統一建模技術,能夠同時理解和生成文本、圖像、音頻和視頻等多種信息,展現出強大的多模態能力。文心5.0在多個領域表現出色,其語言與多模態理解能力與國際頂尖模型相當,而圖像和視頻生成能力在全球領先。用戶可以通過文心App體驗功能,開發者和企業用戶也可以通過百度千帆平臺調用API服務。

【AiBase提要:】
🚀 文心5.0採用原生全模態技術,支持文本、圖像、音頻和視頻等多種信息的理解與生成。
📈 在權威基準測試中,文心5.0的多模態理解能力與全球頂尖模型相當,顯示出其強大潛力。
🌐 用戶可通過文心 App 體驗新模型,開發者可調用 API 服務,推動智能應用的發展。
3、微博推出 VibeThinker-1.5B,低成本 AI 模型挑戰大型語言模型
微博推出 VibeThinker-1.5B,這是一個擁有15億參數的大型語言模型(LLM),基於阿里巴巴的 Qwen2.5-Math-1.5B 進行了精細調整,並在 Hugging Face、GitHub 和 ModelScope 上免費提供。儘管體積較小,但在數學和代碼任務上表現出色,甚至超越了6710億參數的 DeepSeek 的 R1 模型。其後期訓練成本僅7800美元,遠低於同類模型。VibeThinker-1.5B 採用了名爲“譜 - 信號原則”的訓練框架,使得小模型也能實現高效的推理能力。

【AiBase提要:】
🧠 VibeThinker-1.5B 是微博推出的15億參數開源 AI 模型,表現出色,甚至超越大型模型。
💰 該模型後期訓練成本僅爲7800美元,遠低於同類模型數十萬的費用。
🔍 採用 “譜 - 信號原則” 訓練框架,使小模型能夠高效推理,提升了小型模型的競爭力。
詳情鏈接:https://huggingface.co/WeiboAI/VibeThinker-1.5B
4、OpenAI重磅推出GPT-5.1:更快、更準、更具“人情味”的個性化AI助理
OpenAI推出了GPT-5.1,旨在提升ChatGPT的靈活性、響應速度和個性化體驗。新模型在語言表達、對話風格適應性以及情緒感知方面有顯著改進,同時引入了自適應推理功能,以滿足不同任務的需求。

【AiBase提要:】
🚀 GPT-5.1提升了響應速度和語言清晰度,使對話更加自然。
🧠 新增自適應推理功能,能根據問題複雜度調整處理時間。
🎨 提供多種溝通風格選擇,增強用戶個性化體驗。
5、李飛飛的 World Labs 發佈首款商用 3D 世界模型 Marble,支持多種輸入生成
李飛飛的World Labs發佈了首款商用3D世界模型Marble,支持多種輸入方式生成可編輯的3D環境,並具備AI編輯功能,兼容主流VR設備,適用於遊戲開發、影視特效等多個領域。

【AiBase提要:】
🌟 Marble 是首款商用的3D世界模型,支持多種輸入生成可編輯環境。
🎮 該產品內置AI編輯工具,讓用戶更便捷地設計和定製3D場景。
🕶️ Marble 兼容主流VR設備,用戶可立即體驗生成的3D世界。
詳情鏈接:https://marble.worldlabs.ai/
6、東北大學開源多語言翻譯“核彈”!NiuTrans.LMT支持60語種234方向,低資源語言翻譯重大突破
東北大學開源的NiuTrans.LMT大模型在多語言翻譯領域取得重大突破,支持60種語言、234個翻譯方向,尤其在低資源語言上實現顯著進展。其雙中心架構避免了二次失真,提升了跨文化交互的效率和準確性。
【AiBase提要:】
🧠 雙中心架構打破英語霸權,支持中英雙核心翻譯
🌐 三層語言覆蓋兼顧效率與公平,提升低資源語言翻譯能力
🚀 兩階段訓練登頂FLORES-200,性能卓越
詳情鏈接:https://github.com/NiuTrans/LMT
7、谷歌Gemini Live語音大升級!語速隨心調、口音任你選,ChatGPT語音模式遭遇最強挑戰
谷歌Gemini Live語音功能的升級,通過五大核心能力將AI對話推向新高度,爲用戶帶來更自然、個性化的交互體驗。

【AiBase提要:】
🗣️語速隨口令實時變化,支持個性化語言訓練。
😊情緒感知,語氣自適應,提升對話體驗。
🎭口音個性注入,讓對話更有趣。
8、阿里“千問”項目祕密啓動:基於Qwen模型,全面對標ChatGPT發起C端AI未來之戰
阿里巴巴啓動代號爲“千問”的重大項目,旨在打造同名個人AI助手,全面對標ChatGPT。此舉標誌着阿里正式加入全球AI應用的頂級競賽,並將C端AI應用推向戰略核心。
【AiBase提要:】
🚀 阿里巴巴啓動“千問”項目,打造個人AI助手,全面對標ChatGPT。
💡 基於Qwen模型的優秀性能和國際影響力,阿里希望贏得AI競爭。
📈 阿里將C端AI應用推向戰略核心,佈局面向消費者市場。
