歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、阿里通義萬相Wan2.1-VACE開源 號稱首個開源的視頻編輯統一模型
通義萬相宣佈VACE開源,支持多種分辨率和任務,提供一站式視頻創作體驗,通過多模態輸入機制實現高效靈活的視頻編輯。
【AiBase提要:】
✨ 支持文生視頻、圖像參考生成、局部編輯與視頻擴展等多種任務,提高創作效率。
🌟 強大的可控重繪能力,基於人體姿態、運動光流等控制生成,支持主體和背景參考。
🔧 提出視頻條件單元VCU,統一多模態輸入,實現多任務自由組合與靈活編輯。
詳情鏈接:https://github.com/Wan-Video/Wan2.1
2、OpenAI 升級 ChatGPT:正式引入GPT-4.1代碼能力超強
OpenAI發佈了GPT-4.1及其輕量級版本GPT-4.1mini,顯著增強了編碼能力和指令執行體驗,同時優化了用戶體驗和多模態支持,鞏固了其在AI領域的領先地位。
【AiBase提要:】
🚀 GPT-4.1具備強大的編碼能力,處理複雜編程需求更高效,運行速度更快,是開發者和指令處理場景的理想選擇。
🌐 GPT-4.1mini輕量級且高效,在資源受限設備上仍能流暢運行,爲免費和付費用戶提供廣泛訪問渠道。
🌟 ChatGPT新增多項功能如長按複製、表格複製和流式傳輸,界面優化顯著提升用戶體驗。
3、Stability AI開源341M超輕量文字轉語音模型,手機本地可跑,音頻生成僅需8秒!
Stability AI發佈了一款名爲‘Adversarial Post-Training加速的快速文字轉音頻生成’的超輕量文字轉語音模型,參數僅爲341M,卻能在H100GPU上75毫秒生成12秒音頻,在手機CPU上7秒完成同樣任務,性能炸裂且多樣性強。
【AiBase提要:】
⚡️ARC後訓練方法不基於蒸餾,提升模型生成速度與質量。
📱模型輕量化設計,支持手機本地運行,大幅提升移動端創意應用體驗。
💫音頻轉音頻功能實現風格遷移,激發更多創作靈感。
詳情鏈接:https://arxiv.org/pdf/2505.08175
4、Poe 報告:可靈大模型視頻生成量約佔30%份額 領先Runway
近日發佈的2025年春季AI模型使用趨勢報告顯示,中國快手的可靈多款視頻生成模型在文生視頻領域表現突出,市場份額達30%,其中可靈2.0模型僅三週就佔21%使用比例。自去年6月發佈以來,全球用戶突破2200萬,月活躍用戶增長25倍,生成視頻和圖片數量顯著。
【AiBase提要:】
🌟 可靈大模型在文生視頻領域市場份額達30%,領先Runway等競爭者。
📈 可靈2.0模型自4月發佈後三週內即佔據21%視頻生成市場。
👥 可靈AI全球用戶超2200萬,月活躍用戶增長25倍,生成視頻與圖片數量顯著增加。
5、微軟 WizardLM 團隊“集體跳槽”騰訊,或已併入混元大模型研發體系
微軟的人工智能研究團隊 WizardLM 整體加入騰訊 AI 實驗室的“混元”團隊,標誌着騰訊在大模型領域進一步發力。該團隊不僅帶來了多項技術突破,還通過開源模型展示了其研發實力。
【AiBase提要:】
✨ 曾隸屬於微軟的 WizardLM 團隊整體加入騰訊混元團隊,強化了騰訊在大模型領域的競爭力。
🚀 Hunyuan-TurboS0416模型首次使用“混元”命名,象徵着團隊與騰訊的深度融合。
💼 騰訊計劃大幅增加 AI 投資,目標是在全球 AI 競爭中佔據更爲主導的地位。
6、騰訊宣佈混元圖像2.0將於5月16日全新發布
騰訊混元大模型團隊宣佈,混元圖像2.0將在5月16日發佈,這是騰訊在AI視覺領域的重要突破,以‘更智能、更開放、更中國’爲核心理念。
【AiBase提要:】
🌟 混元圖像2.0將於5月16日發佈,標誌着騰訊在AI視覺領域的又一重要進展。
🌐 新工具強調‘更智能、更開放、更中國’,助力創作者和企業邁向AI驅動的視覺生產新時代。
🚀 繼去年混元大模型升級後,騰訊再次展示其在人工智能領域的持續創新力。
7、上海啓動人工智能標識生態聯盟,小紅書和 MiniMax 等首批入盟
本文介紹了上海市成立的人工智能標識生態聯盟,該聯盟旨在推動人工智能領域的標識技術發展,提高生成內容的透明度和安全性,並通過政策解讀和企業合作,爲構建可信的人工智能環境奠定基礎。
【AiBase提要:】
🌟 聯盟由上海市委網信辦指導,匯聚多家知名企業,目標是提升AI生成內容的透明度和安全性。
🔍 國家互聯網應急中心和中國電子技術標準化研究院解讀相關政策,強調國際規則與中國特色的結合。
🤝 小紅書、MiniMax等企業參與標識工作實踐,探索多種內容的標識方案並積累治理經驗。
8、Lightricks發佈LTX-Video-13B精煉模型!10秒生成高清AI視頻,速度與質量雙飛躍!
以色列科技公司Lightricks發佈的開源AI視頻生成模型LTX-Video-13B精煉模型,以130億參數爲基礎,結合多尺度渲染技術和高效量化優化,將視頻生成速度提升至10秒以內,同時保持高質量輸出。
【AiBase提要:】
🚀 採用多尺度渲染技術,10秒內生成高清視頻,速度提升5倍以上。
🌍 開源模型,支持低顯存設備運行,降低AI視頻製作成本。
🌟 生成速度提升30倍,媲美專業影視作品,重塑內容創作生態。
詳情鏈接:https://github.com/Lightricks/LTX-Video
9、谷歌AlphaEvolve發佈!Gemini自進化AI破解數學難題,優化芯片與數據中心,訓練速度飆升32.5%
谷歌DeepMind發佈的AlphaEvolve是一款結合Gemini大語言模型與進化算法的AI編碼代理,它在多個領域展現了強大的自優化能力,包括數據中心調度、芯片設計、AI訓練以及數學研究。
【AiBase提要:】
🌟 Gemini與進化算法結合,解決複雜問題如芯片優化和數學難題。
🚀 AlphaEvolve優化數據中心調度,回收0.7%全球算力,節省運營成本。
🔍 提升AI訓練效率,Gemini模型訓練速度提升32.5%,展現強大自我優化能力。
10、騰訊元寶瀏覽器插件嚐鮮版上線Chrome
騰訊元寶瀏覽器插件嚐鮮版上線Chrome平臺,提供懸浮球、常駐側邊欄和劃詞工具欄等功能,提升網頁瀏覽與信息處理效率。
【AiBase提要:】
✨懸浮球功能支持一鍵翻譯和總結網頁內容,輕鬆跨越語言障礙並節省閱讀時間。
💬常駐側邊欄可高效答疑,支持截圖提問,大幅提升信息獲取效率。
🔍劃詞工具欄實現選中文本後的即時搜索或翻譯,讓信息處理更流暢。
詳情鏈接:https://yuanbao.tencent.com/download