AI日報：Open-Sora Plan v1.2發佈；Mistral Large2突然開源；騰訊智影推智能畫布功能

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、震撼來襲!Open-Sora Plan v1.2發佈，清晰度、推理速度起飛

Open-Sora Plan v1.2版本引入新的3D全注意力架構，提升了對物理世界的理解能力。更新帶來了全新的3D全注意力架構，文本生成視頻能力升級，清晰度和一致性提升，空間與時間完美融合，推理速度大幅提升。Open-Sora團隊開源代碼、數據、模型，致力讓每個人成爲視頻創作的上帝。

【AiBase提要:】
🌟 新的3D全注意力架構讓AI對物理世界有質的飛躍，360度無死角理解立體世界。
🎥 文本生成視頻能力升級，敲下文字即可呈現栩栩如生的視頻畫面。
⏱️ 空間與時間完美融合，視頻在空間表現和時間流暢度上顯著提升。
詳情鏈接:https://top.aibase.com/tool/open-sora-plan-v1-2

2、神仙打架!Mistral Large2突然開源:1230億個參數、媲美Llama3.1

Mistral AI推出旗艦模型Mistral Large2，擁有1230億個參數，超大的128k上下文窗口，性能與成本表現卓越。用戶可通過La Plateforme訪問新模型，在雲服務平臺上廣泛應用。

【AiBase提要:】
🌟 Mistral Large2具備128k上下文窗口，支持多達十種語言及80多種編程語言。
📈 在MMLU基準測試中實現84.0%的準確率，性能與成本表現卓越。
💻 用戶可通過La Plateforme訪問新模型，並在雲服務平臺上廣泛應用。
詳情鏈接:https://console.mistral.ai/

3、騰訊智影PC端推出“智能畫布”功能

騰訊智影PC端最近推出了一項新功能——“智能畫布”，爲用戶提供了多種實用的圖片編輯功能，結合AI繪畫技術，讓作圖變得更加輕鬆。這項功能特別適合需要對AI繪畫圖片進行再創作、摳圖、消除、擴圖等編輯操作的用戶。用戶現在可以登錄智影首頁，體驗這些新功能。

【AiBase提要:】
🎨 智能畫布結合AI繪畫技術，提供多種實用的圖片編輯功能，讓用戶輕鬆進行再創作、摳圖、消除、擴圖等操作。
🖌️ 用戶可以選擇畫布尺寸並上傳圖片，利用豐富的素材貼紙和工具進行編輯，還可進行AI創作。
🔍 智能畫布提供圖片AI調整功能，包括裁剪、摳圖、消除、擴圖、局部重繪、無損高清，滿足各種創意和專業需求。

4、金山辦公WPS AI上線“AI 伴寫”功能

金山辦公最近推出了WPS AI中的AI伴寫功能，旨在提升用戶寫作效率和質量。用戶可通過WPS Office界面啓用該功能，享受智能建議和續寫服務，輕鬆表達靈感。AI伴寫還提供多樣化的內容生成和中華詩詞引用支持，增強寫作連貫性。WPS AI2.0升級進一步推動了人工智能在辦公領域的應用。

【AiBase提要:】
✨ 提升寫作效率和質量，智能輔助用戶寫作
📚 多種場景角色滿足不同用戶的寫作需求
💡 提供智能建議、續寫服務和多樣化內容生成，支持中華詩詞引用

5、Stable Video4D橫空出世，一鍵讓你的視頻變身全景大片!

Stable Video4D是一款顛覆性的視頻處理工具，由Stability AI推出，能讓普通視頻變身爲八面玲瓏的全景大片。其快速生成多視角視頻，保持畫面一致性，將影響遊戲開發、視頻編輯和VR製作領域。未來或將改變觀影方式，帶來全新的互動式體驗。

【AiBase提要:】
🎥 Stable Video4D能讓普通視頻變身爲全景大片，展現多角度細節。
🔮 快速生成多視角視頻，保持畫面一致性，應用前景廣闊。
🌌 未來或將改變觀影方式，帶來全新的互動式體驗。
詳情鏈接:https://huggingface.co/stabilityai/sv4d

6、AI音樂生成工具Udio更新 V1.5模型音質提升顯著

昨晚，AI音樂生成工具Udio帶來了一系列令人矚目的更新，其中V1.5模型的音質得到顯著提升，爲音樂創作者提供更清晰豐富的聽覺體驗。新功能包括關鍵音調控制、多語言支持等，拓寬了用戶羣體。產品功能增強包括專屬創作頁面、下載音樂片段等，提供更個性化和高效的創作環境。

【AiBase提要:】
✨ V1.5模型音質顯著提升，提供更清晰豐富的聽覺體驗。
🎵 新功能包括關鍵音調控制和多語言支持，滿足創作者需求。
🔧 產品功能增強包括專屬創作頁面、下載音樂片段，提供更個性化和高效的創作環境。
詳情鏈接:https://top.aibase.com/tool/udio

7、媲美GPT-4o!復旦推語音模型SpeechGPT2能聽懂你的喜怒哀樂

SpeechGPT2是復旦大學研究團隊提出的一種創新的大型語言模型，具有跨模態的語音理解和生成能力。雖然展現出強大的任務執行能力，但仍存在噪聲魯棒性和音質穩定性方面的挑戰。團隊計劃未來開源技術報告、代碼和模型權重，以推動技術的進一步發展和完善。

【AiBase提要:】
🔑 SpeechGPT2是一種新型的大型語言模型，具有跨模態的語音理解和生成能力。
🔑 SpeechGPT2通過三階段訓練策略，包括模態適應預訓練、跨模態指令微調和模態鏈指令微調。
🔑 SpeechGPT2展現出強大的能力，在文本任務、跨模態任務和口語對話任務上表現出色。
詳情鏈接:https://top.aibase.com/tool/speechgpt2

8、Reddit開啓 “付費牆”，屏蔽搜索引擎和AI機器人隨意抓取內容

Reddit最近採取了引人注目的舉動，開始限制各大搜索引擎和AI機器人獲取其內容，需付費才能獲取。這一舉措導致除Google外的搜索引擎無法輕易訪問最新的Reddit內容，引發了廣泛關注和討論。

【AiBase提要:】
🌐 付費牆開啓: Reddit限制搜索引擎和AI機器人訪問內容，需付費才能獲取。
🤖 Google獨佔資源: 只有Google能通過“site:reddit.com”獲取最新結果，其他搜索引擎被排除。
💰 數據變現策略: Reddit加強數據保護，提升API費用，尋求新的收入來源以吸引投資者。

9、Nvidia AI推ChatQA2長文本理解和RAG能力媲美GPT-4

在人工智能的快速發展中，長文本上下文理解和檢索增強生成（RAG）的能力變得至關重要。Nvidia AI 的最新研究——ChatQA2模型，正是爲了應對這一挑戰而生。ChatQA2通過擴展上下文窗口和實施三階段指令調整過程，取得了與GPT-4-Turbo相媲美的長文本理解和RAG性能。

【AiBase提要:】
⚙️ ChatQA2通過將上下文窗口擴展到128K tokens，顯著提升了指令遵循能力和長文本理解。
🔍 ChatQA2在InfiniteBench評估中超越了GPT-4-Turbo，在多項任務上表現出全面能力。
💡 ChatQA2解決了RAG流程中的關鍵問題，提高了檢索的準確性和效率。
詳情鏈接:https://arxiv.org/abs/2407.14482

10、百川智能完成50億元A輪融資，估值達200億元

百川智能近期完成A輪融資，融資總額達50億元人民幣，估值攀升至200億元。這標誌着大模型初創公司取得了重要的資本支持，展現出行業發展的活力和潛力。

【AiBase提要:】
🚀 大模型初創公司百川智能完成50億元A輪融資，估值達200億元，吸引國資背景產業投資基金加入。
💡 百川智能在醫療AI領域表現突出，Baichuan3模型超越GPT-4，提出AI醫療的L0-L5分級發展路線。
💰 大模型行業融資格局變化，國資背景基金成爲重要資金來源，公司採取超級模型+超級應用雙輪驅動策略。

11、英偉達推出 Minitron 小型語言模型

英偉達最新推出的Minitron小型語言模型在人工智能領域引起轟動。這一系列模型訓練速度提高了40倍，通過修剪和知識蒸餾技術，大幅降低了訓練成本，並已開源在Huggingface上，推動AI技術普及。

【AiBase提要:】
📈 提升訓練速度: Minitron模型訓練速度比傳統模型快40倍，省時省力。
💡 節省成本: 通過修剪和知識蒸餾技術，降低訓練所需的計算資源和數據量。
🌍 開源共享: Minitron模型已在Huggingface上開源，促進更多人獲取和使用AI技術。
詳情鏈接:https://huggingface.co/collections/nvidia/minitron-669ac727dc9c86e6ab7f0f3e

12、OpenBuddy開源大語言模型團隊發佈Llama3.1-8B模型中文版

Meta最近發佈了新一代開源模型系列Llama3.1，其中包括一個405B參數的版本，其性能接近甚至在某些基準測試中超越了GPT-4等閉源模型。OpenBuddy利用Llama3.1-8B-Instruct模型，通過在少量中文數據上進行訓練，發佈了OpenBuddy-Llama3.1-8B-v22.1-131K，具備中文問答和跨語言翻譯能力。

【AiBase提要:】
🚀 Llama3.1-8B-Instruct是新一代開源模型，支持多語言且上下文長度高達131072tokens，展現出與GPT3.5Turbo相近的認知和推理能力。
🔍 OpenBuddy-Llama3.1-8B-v22.1-131K是具備中文問答和跨語言翻譯能力的新一代開源跨語言模型，展現出更強的認知潛力。
💡 OpenBuddy計劃對8B和70B模型進行更大規模的訓練，以增強模型的中文知識儲備、長文能力和認知能力，並探索微調405B模型的可能性。
詳情鏈接:https://modelscope.cn/models/OpenBuddy/openbuddy-llama3.1-8b-v22.1-131k

13、顛覆認知!AI自訓練9次崩潰牛津劍橋發現AI潛藏致命弱點

這篇文章揭示了通過再訓練AI圖像生成模型使用自己生成的圖像可能導致模型崩潰的現象。研究人員發現，即使只包含少量自生成圖像在再訓練數據中，模型也會產生高度扭曲的圖像，難以完全恢復。這一發現提醒我們AI系統對數據“污染”非常敏感，需要謹慎處理。

【AiBase提要:】
⚠️ 再訓練AI模型使用自生成圖像可能導致模型崩潰，圖像質量急劇下降
🔍 模型崩潰不僅影響圖像質量，還導致生成的圖像缺乏多樣性
⚔️ 一旦模型被“污染”，恢復困難且可能是長期甚至不可逆的
詳情鏈接:https://arxiv.org/pdf/2311.12202

AI日報：Open-Sora Plan v1.2發佈；Mistral Large2突然開源；騰訊智影推智能畫布功能

相關推薦

MiniMax計劃推出新一代大模型參數規模2.7萬億

微軟測試iPad版Word新版本:深度整合Copilot AI助手輔助文檔編輯

谷歌相冊推出AI“視頻混音”功能：搭載Gemini Omni，主打數秒內電影級剪輯

氣象預警再升級：“媽祖”大模型已覆蓋全球 40 餘國

砸下 190 億美金！AI巨頭 Anthropic 豪租數據中心 20 年

AI日報：Open-Sora Plan v1.2發佈；Mistral Large2突然開源；騰訊智影推智能畫布功能

相關推薦

MiniMax計劃推出新一代大模型 參數規模2.7萬億

微軟測試iPad版Word新版本:深度整合Copilot AI助手輔助文檔編輯

谷歌相冊推出AI“視頻混音”功能：搭載Gemini Omni，主打數秒內電影級剪輯

氣象預警再升級：“媽祖”大模型已覆蓋全球 40 餘國

砸下 190 億美金！AI巨頭 Anthropic 豪租數據中心 20 年

MiniMax計劃推出新一代大模型參數規模2.7萬億