AI日報：重磅！阿里新夸克升級爲“AI超級框”；谷歌開源多模態模型Gemma-3；潞晨科技開源視頻大模型Open-Sora 2.0

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、阿里巴巴推出AI旗艦應用“新夸克” 全面升級爲“AI超級框”

阿里巴巴於3月13日推出了其全新升級的AI旗艦應用——新夸克。這款應用基於阿里通義的先進推理與多模態大模型，整合了多種AI功能，旨在爲用戶提供無縫的智能體驗。新夸克不僅能夠進行智能對話，還具備深度思考和執行能力，能夠滿足用戶在多個場景下的需求。

【AiBase提要:】
🤖 新夸克整合了AI對話、深度思考、深度搜索等多種功能，提供一站式服務。
📊 通過智能中樞系統，新夸克能夠自動識別用戶指令並進行深度執行。
🌐 阿里巴巴計劃將通義系列模型的最新成果快速接入新夸克，以增強其功能。

2、谷歌開源新一代多模態模型 Gemma-3:性能卓越、成本降低10倍

谷歌最新發佈的多模態大模型Gemma-3以其低成本和高性能引起了廣泛關注。該模型支持多種參數規模，最大可達270億參數，且僅需一張H100顯卡進行高效推理，算力需求顯著降低。Gemma-3在對話模型評比中表現優異，支持長文本處理和多模態數據，展現出強大的語言處理能力和創新的架構設計，是當前算力要求最低的高性能模型之一。

【AiBase提要:】
🔍 Gemma-3是谷歌最新開源的多模態大模型，參數範圍從10億到270億，且算力需求降低10倍。
💡 模型採用創新的架構設計，有效處理長上下文和多模態數據，支持文本與圖像的同時處理。
🌐 Gemma-3支持140種語言的處理能力，經過訓練優化後在多項任務中表現優異，展現了強大的綜合能力。
詳情鏈接:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

3、百度文心快碼推出Comate Zulu版本並正式開放公測

百度旗下的文心快碼推出了Comate Zulu版本，標誌着在智能編程領域的一次重大突破。該版本通過結合文心大模型的強大能力和豐富的編程大數據，爲開發者提供了更高效的編程體驗。用戶可以通過自然語言與系統進行交流，快速搭建項目和理解代碼邏輯，大幅提升開發效率。公測活動將持續至3月28日，開發者可以在主流IDE中體驗這一創新功能。

【AiBase提要:】
🛠️ 通過全自然語言實現需求，無需編寫代碼即可自動搭建項目，支持口語交流和圖片展示。
📊 快速理解代碼庫的業務邏輯，提供架構圖梳理和智能啓發思路，幫助開發者迅速上手新項目。
⚙️ 自動搭建開發環境，支持依賴自動安裝和服務自啓動，實現從需求到代碼的端到端生成。
詳情鏈接:https://comate.baidu.com

4、字節Trae接入硅基流動SiliconCloud 支持DeepSeek多款模型API

硅基流動平臺與字節跳動推出的AI IDE——Trae正式接入，提升了開發者的編程體驗。用戶可以通過簡單的步驟接入多款編碼模型，包括DeepSeek-R1、V3等，滿足不同需求。平臺還提供免費的API服務，助力開發者實現更高效的開發過程。未來，硅基流動將繼續擴展模型種類和合作應用，致力於爲開發者提供更穩定的服務。

【AiBase提要:】
🔧 Trae接入硅基流動，提供多種高效編碼模型，提升編程體驗。
🔑 用戶可通過簡單步驟添加模型，獲取API密鑰。
🚀 硅基流動致力於提供穩定的API服務，未來將擴展模型種類。

5、王炸更新!谷歌AI Studio再進化:YouTube視頻秒懂，AI作畫還能保持角色統一

谷歌AI Studio的最新升級引發了科技圈的轟動，用戶現在可以直接通過YouTube鏈接理解視頻內容，無需下載和上傳。Gemini2.0Flash Experimental模型不僅在視頻解析上表現出色，還在圖像生成方面展現了驚人的一致性。

【AiBase提要:】
🎥 谷歌AI Studio現在支持直接解析YouTube視頻鏈接，用戶可快速理解視頻內容。
🖼️ Gemini2.0Flash exp在圖像生成方面表現卓越，角色在多張圖片中保持一致性。
⚡ 更新標誌着谷歌AI Studio從基礎模型嚮應用級工具的轉型，影響現有AI工具生態。
詳情鏈接:https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube

6、叫板Sora?潞晨科技開源視頻大模型Open-Sora2.0，降本提速

潞晨科技推出的Open-Sora2.0以其僅20萬美元的訓練成本和110億參數的強大性能，成功挑戰了OpenAI Sora等行業標杆。該模型在多個評測中表現優異，尤其在VBench中與OpenAI Sora的性能差距縮小至0.69%。

【AiBase提要:】
💰 成本低:Open-Sora2.0僅需20萬美元訓練成本，顯著低於行業標準。
📈 性能強:擁有110億參數，性能接近OpenAI Sora，VBench評測中表現優異。
🌐 開源共享:全流程訓練代碼開源，推動視頻生成技術的共同發展。
詳情鏈接:https://github.com/hpcaitech/Open-Sora

7、阿里通義新視頻生成和編輯模型VACE 可控制運動軌跡、替換主體等

阿里通義Wan團隊推出了全新的VACE模型，旨在降低視頻製作的門檻並提升創作效率。VACE的按條件生成視頻功能讓用戶可以通過文字描述快速實現創意，彷彿擁有了一支夢幻攝製組。此外，VACE還具備多種強大的編輯功能，如物體運動軌跡控制、視頻主體替換、風格遷移和視頻畫面智能擴展等。

【AiBase提要:】
🎬 VACE模型通過文字描述快速生成視頻，提升創作效率。
🔄 支持物體運動軌跡控制和視頻主體替換，靈活多變。
🖼️ 具備視頻畫面智能擴展和風格遷移功能，豐富創作表現。
詳情鏈接:https://arxiv.org/pdf/2503.07598

8、理想汽車AI助手理想同學網頁版上線:接入DeepSeek R1滿血版

理想汽車正式推出其人工智能助手理想同學網頁版，標誌着其在智能服務領域的進一步擴展。該助手接入了DeepSeek R1V3671B滿血版，提供強大的問答能力和跨場景服務協同。用戶可以在不同模型之間切換，支持長文本輸入及圖像問答功能，提升了交互體驗。

【AiBase提要:】
💻 理想同學網頁版現已上線，用戶可在電腦端使用，拓展智能服務生態。
🔍 接入DeepSeek R1V3671B滿血版，支持模型切換和深度思考功能，提升問答能力。
🖼️ 支持千字長文本輸入和圖像問答，提供更強的用戶交互體驗。

9、谷歌Gemini2.0Flash放出原生多模態圖像生成功能:支持多輪對話式實時編輯

谷歌最新推出的Gemini2.0Flash在AI圖像生成領域引入了原生圖像生成技術，顯著提升了生成效率和準確性。與以往依賴於大型語言模型的方式不同，Gemini2.0Flash實現了圖像生成與文本理解的直接集成，使得創作過程更加流暢。

【AiBase提要:】
🎨 原生圖像生成:Gemini2.0Flash將圖像生成功能直接集成，避免了信息失真，提高了生成效率和準確性。
🖌️ 實時編輯:支持多輪對話式編輯，用戶可以用自然語言提出修改意見，AI能夠即時響應並調整圖像。
📈 企業應用:爲營銷團隊和開發者提供強大工具，快速生成內容，降低設計成本，提高工作效率。

10、Remade AI 開源8款 Wan2.1特效 LoRA，掀起 AI 視頻創作新熱潮

Remade AI 在 Hugging Face 平臺推出了8款基於 Wan2.1模型的開源特效 LoRA，吸引了科技界的廣泛關注。這些特效模塊不僅能夠將靜態圖像轉化爲動態視頻，還爲 AI 視頻生成帶來了新的創意可能性。

【AiBase提要:】
🎨8款新特效 LoRA 包括擠壓、蛋糕化、膨脹等，豐富了 AI 視頻創作的可能性。
💻 Wan2.1模型以其高效性和多功能性，成爲視頻生成領域的頂尖選擇。
🌍 Remade AI 邀請全球用戶提出定製需求，承諾持續開源更多特效模塊。

11、AI對口型革命性突破:Captions新模型Mirage打造超真實UGC視頻

Captions公司推出的全新AI模型Mirage，標誌着視頻生成技術的重大突破。該模型能夠實時生成UGC風格視頻，面部表情與肢體語言的真實度超越以往技術，簡化了視頻製作流程，尤其對廣告和內容創作者而言，將成本和時間大幅縮減。

【AiBase提要:】
🚀 Mirage模型能夠實時生成UGC視頻，無需依賴預錄素材或傳統工具。
🎭 生成的角色面部表情與肢體語言真實度極高，難以分辨真假。
🌍 支持29種語言生成視頻，極大簡化視頻製作流程，降低成本與時間。
詳情鏈接:https://www.captions.ai/mirage

12、谷歌推機器人控制模型Gemini Robotics，讓機器人像人類一樣思考行動

谷歌的Gemini Robotics是一個革命性的機器人控制模型，旨在將人工智能的智慧注入機器人，使其在物理世界中更智能地行動。基於Gemini2.0模型，Gemini Robotics具備強大的多模態理解能力，能夠理解文本、圖像、音頻和視頻，並具備出色的泛化能力，能快速適應新環境和指令。

【AiBase提要:】
🚀 Gemini Robotics基於Gemini2.0模型，具備強大的多模態理解能力，能夠處理文本、圖像、音頻和視頻。
🧠 該模型展現出卓越的泛化能力，能夠迅速適應新物體和環境，解決各種實際問題。
🔒 谷歌在安全性方面採取了全面措施，確保機器人在執行任務時的安全性和可靠性。
詳情鏈接:https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/

13、智譜AI宣佈再獲珠海5億元融資

珠海華髮集團近期宣佈向智譜公司投資5億元人民幣，旨在推動其GLM大模型的技術創新與生態發展。這一舉措標誌着珠海國資正式加入智譜的投資陣容。智譜在融資方面表現優異，去年成功完成多輪融資，總額超過40億元，吸引了多家知名投資機構。

【AiBase提要:】
💡 珠海華髮集團向智譜進行5億元戰略投資，支持其技術創新與生態發展。
🚀 智譜在融資方面表現強勁，去年完成超過40億元的多輪融資，投資者涵蓋多個城市的國資力量。
🌐 預計到2025年，智譜將推出全新開源大模型，推動AI行業的繁榮與發展。

AI日報：重磅！阿里新夸克升級爲“AI超級框”；谷歌開源多模態模型Gemma-3；潞晨科技開源視頻大模型Open-Sora 2.0

相關推薦

大麥娛樂聯合阿里通義發佈“妙呀”平臺:基於Wan2.7打造首個AI潮玩設計工具

阿里通義推出Qwen3-Omni-Flash-2025-12-01

阿里通義推出 Z-Image 模型，首日下載量突破 50 萬

斯坦福頂尖科學家許主洪加盟阿里通義

阿里通義推出 Qwen3-ASR-Toolkit，實現音視頻轉錄新突破

AI日報：重磅！阿里新夸克升級爲“AI超級框”；谷歌開源多模態模型Gemma-3；潞晨科技開源視頻大模型Open-Sora 2.0

相關推薦

大麥娛樂聯合阿里通義發佈“妙呀”平臺:基於Wan2.7打造首個AI潮玩設計工具

​阿里通義推出Qwen3-Omni-Flash-2025-12-01

​阿里通義推出 Z-Image 模型，首日下載量突破 50 萬

斯坦福頂尖科學家許主洪加盟阿里通義

阿里通義推出 Qwen3-ASR-Toolkit，實現音視頻轉錄新突破

阿里通義推出Qwen3-Omni-Flash-2025-12-01

阿里通義推出 Z-Image 模型，首日下載量突破 50 萬