AI日報：GPT-4.1正式上線ChatGPT；阿里通義萬相Wan2.1-VACE開源；可靈大模型視頻生成量約佔30%份額

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、阿里通義萬相Wan2.1-VACE開源號稱首個開源的視頻編輯統一模型

通義萬相宣佈VACE開源，支持多種分辨率和任務，提供一站式視頻創作體驗，通過多模態輸入機制實現高效靈活的視頻編輯。

【AiBase提要:】
✨ 支持文生視頻、圖像參考生成、局部編輯與視頻擴展等多種任務，提高創作效率。
🌟 強大的可控重繪能力，基於人體姿態、運動光流等控制生成，支持主體和背景參考。
🔧 提出視頻條件單元VCU，統一多模態輸入，實現多任務自由組合與靈活編輯。
詳情鏈接:https://github.com/Wan-Video/Wan2.1

2、OpenAI 升級 ChatGPT:正式引入GPT-4.1代碼能力超強

OpenAI發佈了GPT-4.1及其輕量級版本GPT-4.1mini，顯著增強了編碼能力和指令執行體驗，同時優化了用戶體驗和多模態支持，鞏固了其在AI領域的領先地位。

【AiBase提要:】
🚀 GPT-4.1具備強大的編碼能力，處理複雜編程需求更高效，運行速度更快，是開發者和指令處理場景的理想選擇。
🌐 GPT-4.1mini輕量級且高效，在資源受限設備上仍能流暢運行，爲免費和付費用戶提供廣泛訪問渠道。
🌟 ChatGPT新增多項功能如長按複製、表格複製和流式傳輸，界面優化顯著提升用戶體驗。

3、Stability AI開源341M超輕量文字轉語音模型，手機本地可跑，音頻生成僅需8秒!

Stability AI發佈了一款名爲‘Adversarial Post-Training加速的快速文字轉音頻生成’的超輕量文字轉語音模型，參數僅爲341M，卻能在H100GPU上75毫秒生成12秒音頻，在手機CPU上7秒完成同樣任務，性能炸裂且多樣性強。

【AiBase提要:】
⚡️ARC後訓練方法不基於蒸餾，提升模型生成速度與質量。
📱模型輕量化設計，支持手機本地運行，大幅提升移動端創意應用體驗。
💫音頻轉音頻功能實現風格遷移，激發更多創作靈感。
詳情鏈接:https://arxiv.org/pdf/2505.08175

4、Poe 報告:可靈大模型視頻生成量約佔30%份額領先Runway

近日發佈的2025年春季AI模型使用趨勢報告顯示，中國快手的可靈多款視頻生成模型在文生視頻領域表現突出，市場份額達30%，其中可靈2.0模型僅三週就佔21%使用比例。自去年6月發佈以來，全球用戶突破2200萬，月活躍用戶增長25倍，生成視頻和圖片數量顯著。

【AiBase提要:】
🌟 可靈大模型在文生視頻領域市場份額達30%，領先Runway等競爭者。
📈 可靈2.0模型自4月發佈後三週內即佔據21%視頻生成市場。
👥 可靈AI全球用戶超2200萬，月活躍用戶增長25倍，生成視頻與圖片數量顯著增加。

5、微軟 WizardLM 團隊“集體跳槽”騰訊，或已併入混元大模型研發體系

微軟的人工智能研究團隊 WizardLM 整體加入騰訊 AI 實驗室的“混元”團隊，標誌着騰訊在大模型領域進一步發力。該團隊不僅帶來了多項技術突破，還通過開源模型展示了其研發實力。

【AiBase提要:】
✨ 曾隸屬於微軟的 WizardLM 團隊整體加入騰訊混元團隊，強化了騰訊在大模型領域的競爭力。
🚀 Hunyuan-TurboS0416模型首次使用“混元”命名，象徵着團隊與騰訊的深度融合。
💼 騰訊計劃大幅增加 AI 投資，目標是在全球 AI 競爭中佔據更爲主導的地位。

6、騰訊宣佈混元圖像2.0將於5月16日全新發布

騰訊混元大模型團隊宣佈，混元圖像2.0將在5月16日發佈，這是騰訊在AI視覺領域的重要突破，以‘更智能、更開放、更中國’爲核心理念。

【AiBase提要:】
🌟 混元圖像2.0將於5月16日發佈，標誌着騰訊在AI視覺領域的又一重要進展。
🌐 新工具強調‘更智能、更開放、更中國’，助力創作者和企業邁向AI驅動的視覺生產新時代。
🚀 繼去年混元大模型升級後，騰訊再次展示其在人工智能領域的持續創新力。

7、上海啓動人工智能標識生態聯盟，小紅書和 MiniMax 等首批入盟

本文介紹了上海市成立的人工智能標識生態聯盟，該聯盟旨在推動人工智能領域的標識技術發展，提高生成內容的透明度和安全性，並通過政策解讀和企業合作，爲構建可信的人工智能環境奠定基礎。

【AiBase提要:】
🌟 聯盟由上海市委網信辦指導，匯聚多家知名企業，目標是提升AI生成內容的透明度和安全性。
🔍 國家互聯網應急中心和中國電子技術標準化研究院解讀相關政策，強調國際規則與中國特色的結合。
🤝 小紅書、MiniMax等企業參與標識工作實踐，探索多種內容的標識方案並積累治理經驗。

8、Lightricks發佈LTX-Video-13B精煉模型!10秒生成高清AI視頻，速度與質量雙飛躍!

以色列科技公司Lightricks發佈的開源AI視頻生成模型LTX-Video-13B精煉模型，以130億參數爲基礎，結合多尺度渲染技術和高效量化優化，將視頻生成速度提升至10秒以內，同時保持高質量輸出。

【AiBase提要:】
🚀 採用多尺度渲染技術，10秒內生成高清視頻，速度提升5倍以上。
🌍 開源模型，支持低顯存設備運行，降低AI視頻製作成本。
🌟 生成速度提升30倍，媲美專業影視作品，重塑內容創作生態。
詳情鏈接:https://github.com/Lightricks/LTX-Video

9、谷歌AlphaEvolve發佈!Gemini自進化AI破解數學難題，優化芯片與數據中心，訓練速度飆升32.5%

谷歌DeepMind發佈的AlphaEvolve是一款結合Gemini大語言模型與進化算法的AI編碼代理，它在多個領域展現了強大的自優化能力，包括數據中心調度、芯片設計、AI訓練以及數學研究。

【AiBase提要:】
🌟 Gemini與進化算法結合，解決複雜問題如芯片優化和數學難題。
🚀 AlphaEvolve優化數據中心調度，回收0.7%全球算力，節省運營成本。
🔍 提升AI訓練效率，Gemini模型訓練速度提升32.5%，展現強大自我優化能力。

10、騰訊元寶瀏覽器插件嚐鮮版上線Chrome

騰訊元寶瀏覽器插件嚐鮮版上線Chrome平臺，提供懸浮球、常駐側邊欄和劃詞工具欄等功能，提升網頁瀏覽與信息處理效率。

【AiBase提要:】
✨懸浮球功能支持一鍵翻譯和總結網頁內容，輕鬆跨越語言障礙並節省閱讀時間。
💬常駐側邊欄可高效答疑，支持截圖提問，大幅提升信息獲取效率。
🔍劃詞工具欄實現選中文本後的即時搜索或翻譯，讓信息處理更流暢。
詳情鏈接:https://yuanbao.tencent.com/download