歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、震撼來襲!Open-Sora Plan v1.2發佈,清晰度、推理速度起飛

Open-Sora Plan v1.2版本引入新的3D全注意力架構,提升了對物理世界的理解能力。更新帶來了全新的3D全注意力架構,文本生成視頻能力升級,清晰度和一致性提升,空間與時間完美融合,推理速度大幅提升。Open-Sora團隊開源代碼、數據、模型,致力讓每個人成爲視頻創作的上帝。

【AiBase提要:】

🌟 新的3D全注意力架構讓AI對物理世界有質的飛躍,360度無死角理解立體世界。

🎥 文本生成視頻能力升級,敲下文字即可呈現栩栩如生的視頻畫面。

⏱️ 空間與時間完美融合,視頻在空間表現和時間流暢度上顯著提升。

詳情鏈接:https://top.aibase.com/tool/open-sora-plan-v1-2

2、神仙打架!Mistral Large2突然開源:1230億個參數、媲美Llama3.1

Mistral AI推出旗艦模型Mistral Large2,擁有1230億個參數,超大的128k上下文窗口,性能與成本表現卓越。用戶可通過La Plateforme訪問新模型,在雲服務平臺上廣泛應用。

【AiBase提要:】

🌟 Mistral Large2具備128k上下文窗口,支持多達十種語言及80多種編程語言。

📈 在MMLU基準測試中實現84.0%的準確率,性能與成本表現卓越。

💻 用戶可通過La Plateforme訪問新模型,並在雲服務平臺上廣泛應用。

詳情鏈接:https://console.mistral.ai/

3、騰訊智影PC端推出“智能畫布”功能

騰訊智影PC端最近推出了一項新功能——“智能畫布”,爲用戶提供了多種實用的圖片編輯功能,結合AI繪畫技術,讓作圖變得更加輕鬆。這項功能特別適合需要對AI繪畫圖片進行再創作、摳圖、消除、擴圖等編輯操作的用戶。用戶現在可以登錄智影首頁,體驗這些新功能。

image.png

【AiBase提要:】

🎨 智能畫布結合AI繪畫技術,提供多種實用的圖片編輯功能,讓用戶輕鬆進行再創作、摳圖、消除、擴圖等操作。

🖌️ 用戶可以選擇畫布尺寸並上傳圖片,利用豐富的素材貼紙和工具進行編輯,還可進行AI創作。

🔍 智能畫布提供圖片AI調整功能,包括裁剪、摳圖、消除、擴圖、局部重繪、無損高清,滿足各種創意和專業需求。

4、金山辦公WPS AI上線“AI 伴寫”功能

金山辦公最近推出了WPS AI中的AI伴寫功能,旨在提升用戶寫作效率和質量。用戶可通過WPS Office界面啓用該功能,享受智能建議和續寫服務,輕鬆表達靈感。AI伴寫還提供多樣化的內容生成和中華詩詞引用支持,增強寫作連貫性。WPS AI2.0升級進一步推動了人工智能在辦公領域的應用。

【AiBase提要:】

✨ 提升寫作效率和質量,智能輔助用戶寫作

📚 多種場景角色滿足不同用戶的寫作需求

💡 提供智能建議、續寫服務和多樣化內容生成,支持中華詩詞引用

5、Stable Video4D橫空出世,一鍵讓你的視頻變身全景大片!

Stable Video4D是一款顛覆性的視頻處理工具,由Stability AI推出,能讓普通視頻變身爲八面玲瓏的全景大片。其快速生成多視角視頻,保持畫面一致性,將影響遊戲開發、視頻編輯和VR製作領域。未來或將改變觀影方式,帶來全新的互動式體驗。

【AiBase提要:】

🎥 Stable Video4D能讓普通視頻變身爲全景大片,展現多角度細節。

🔮 快速生成多視角視頻,保持畫面一致性,應用前景廣闊。

🌌 未來或將改變觀影方式,帶來全新的互動式體驗。

詳情鏈接:https://huggingface.co/stabilityai/sv4d

6、AI音樂生成工具Udio更新 V1.5模型音質提升顯著

昨晚,AI音樂生成工具Udio帶來了一系列令人矚目的更新,其中V1.5模型的音質得到顯著提升,爲音樂創作者提供更清晰豐富的聽覺體驗。新功能包括關鍵音調控制、多語言支持等,拓寬了用戶羣體。產品功能增強包括專屬創作頁面、下載音樂片段等,提供更個性化和高效的創作環境。

【AiBase提要:】

✨ V1.5模型音質顯著提升,提供更清晰豐富的聽覺體驗。

🎵 新功能包括關鍵音調控制和多語言支持,滿足創作者需求。

🔧 產品功能增強包括專屬創作頁面、下載音樂片段,提供更個性化和高效的創作環境。

詳情鏈接:https://top.aibase.com/tool/udio

7、媲美GPT-4o!復旦推語音模型SpeechGPT2能聽懂你的喜怒哀樂

SpeechGPT2是復旦大學研究團隊提出的一種創新的大型語言模型,具有跨模態的語音理解和生成能力。雖然展現出強大的任務執行能力,但仍存在噪聲魯棒性和音質穩定性方面的挑戰。團隊計劃未來開源技術報告、代碼和模型權重,以推動技術的進一步發展和完善。

【AiBase提要:】

🔑 SpeechGPT2是一種新型的大型語言模型,具有跨模態的語音理解和生成能力。

🔑 SpeechGPT2通過三階段訓練策略,包括模態適應預訓練、跨模態指令微調和模態鏈指令微調。

🔑 SpeechGPT2展現出強大的能力,在文本任務、跨模態任務和口語對話任務上表現出色。

詳情鏈接:https://top.aibase.com/tool/speechgpt2

8、Reddit開啓 “付費牆”,屏蔽搜索引擎和AI機器人隨意抓取內容

Reddit最近採取了引人注目的舉動,開始限制各大搜索引擎和AI機器人獲取其內容,需付費才能獲取。這一舉措導致除Google外的搜索引擎無法輕易訪問最新的Reddit內容,引發了廣泛關注和討論。

【AiBase提要:】

🌐 付費牆開啓: Reddit限制搜索引擎和AI機器人訪問內容,需付費才能獲取。

🤖 Google獨佔資源: 只有Google能通過“site:reddit.com”獲取最新結果,其他搜索引擎被排除。

💰 數據變現策略: Reddit加強數據保護,提升API費用,尋求新的收入來源以吸引投資者。

9、Nvidia AI推ChatQA2長文本理解和RAG能力媲美GPT-4

在人工智能的快速發展中,長文本上下文理解和檢索增強生成(RAG)的能力變得至關重要。Nvidia AI 的最新研究——ChatQA2模型,正是爲了應對這一挑戰而生。ChatQA2通過擴展上下文窗口和實施三階段指令調整過程,取得了與GPT-4-Turbo相媲美的長文本理解和RAG性能。

【AiBase提要:】

⚙️ ChatQA2通過將上下文窗口擴展到128K tokens,顯著提升了指令遵循能力和長文本理解。

🔍 ChatQA2在InfiniteBench評估中超越了GPT-4-Turbo,在多項任務上表現出全面能力。

💡 ChatQA2解決了RAG流程中的關鍵問題,提高了檢索的準確性和效率。

詳情鏈接:https://arxiv.org/abs/2407.14482

10、百川智能完成50億元A輪融資,估值達200億元

百川智能近期完成A輪融資,融資總額達50億元人民幣,估值攀升至200億元。這標誌着大模型初創公司取得了重要的資本支持,展現出行業發展的活力和潛力。

【AiBase提要:】

🚀 大模型初創公司百川智能完成50億元A輪融資,估值達200億元,吸引國資背景產業投資基金加入。

💡 百川智能在醫療AI領域表現突出,Baichuan3模型超越GPT-4,提出AI醫療的L0-L5分級發展路線。

💰 大模型行業融資格局變化,國資背景基金成爲重要資金來源,公司採取超級模型+超級應用雙輪驅動策略。

11、英偉達推出 Minitron 小型語言模型

英偉達最新推出的Minitron小型語言模型在人工智能領域引起轟動。這一系列模型訓練速度提高了40倍,通過修剪和知識蒸餾技術,大幅降低了訓練成本,並已開源在Huggingface上,推動AI技術普及。

【AiBase提要:】

📈 提升訓練速度: Minitron模型訓練速度比傳統模型快40倍,省時省力。

💡 節省成本: 通過修剪和知識蒸餾技術,降低訓練所需的計算資源和數據量。

🌍 開源共享: Minitron模型已在Huggingface上開源,促進更多人獲取和使用AI技術。

詳情鏈接:https://huggingface.co/collections/nvidia/minitron-669ac727dc9c86e6ab7f0f3e

12、OpenBuddy開源大語言模型團隊發佈Llama3.1-8B模型中文版

Meta最近發佈了新一代開源模型系列Llama3.1,其中包括一個405B參數的版本,其性能接近甚至在某些基準測試中超越了GPT-4等閉源模型。OpenBuddy利用Llama3.1-8B-Instruct模型,通過在少量中文數據上進行訓練,發佈了OpenBuddy-Llama3.1-8B-v22.1-131K,具備中文問答和跨語言翻譯能力。

image.png

【AiBase提要:】

🚀 Llama3.1-8B-Instruct是新一代開源模型,支持多語言且上下文長度高達131072tokens,展現出與GPT3.5Turbo相近的認知和推理能力。

🔍 OpenBuddy-Llama3.1-8B-v22.1-131K是具備中文問答和跨語言翻譯能力的新一代開源跨語言模型,展現出更強的認知潛力。

💡 OpenBuddy計劃對8B和70B模型進行更大規模的訓練,以增強模型的中文知識儲備、長文能力和認知能力,並探索微調405B模型的可能性。

詳情鏈接:https://modelscope.cn/models/OpenBuddy/openbuddy-llama3.1-8b-v22.1-131k

13、顛覆認知!AI自訓練9次崩潰 牛津劍橋發現AI潛藏致命弱點

這篇文章揭示了通過再訓練AI圖像生成模型使用自己生成的圖像可能導致模型崩潰的現象。研究人員發現,即使只包含少量自生成圖像在再訓練數據中,模型也會產生高度扭曲的圖像,難以完全恢復。這一發現提醒我們AI系統對數據“污染”非常敏感,需要謹慎處理。

image.png

【AiBase提要:】

⚠️ 再訓練AI模型使用自生成圖像可能導致模型崩潰,圖像質量急劇下降

🔍 模型崩潰不僅影響圖像質量,還導致生成的圖像缺乏多樣性

⚔️ 一旦模型被“污染”,恢復困難且可能是長期甚至不可逆的

詳情鏈接:https://arxiv.org/pdf/2311.12202