歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、震撼來襲!Open-Sora Plan v1.2發佈,清晰度、推理速度起飛
Open-Sora Plan v1.2版本引入新的3D全注意力架構,提升了對物理世界的理解能力。更新帶來了全新的3D全注意力架構,文本生成視頻能力升級,清晰度和一致性提升,空間與時間完美融合,推理速度大幅提升。Open-Sora團隊開源代碼、數據、模型,致力讓每個人成爲視頻創作的上帝。
【AiBase提要:】
🌟 新的3D全注意力架構讓AI對物理世界有質的飛躍,360度無死角理解立體世界。
🎥 文本生成視頻能力升級,敲下文字即可呈現栩栩如生的視頻畫面。
⏱️ 空間與時間完美融合,視頻在空間表現和時間流暢度上顯著提升。
詳情鏈接:https://top.aibase.com/tool/open-sora-plan-v1-2
2、神仙打架!Mistral Large2突然開源:1230億個參數、媲美Llama3.1
Mistral AI推出旗艦模型Mistral Large2,擁有1230億個參數,超大的128k上下文窗口,性能與成本表現卓越。用戶可通過La Plateforme訪問新模型,在雲服務平臺上廣泛應用。
【AiBase提要:】
🌟 Mistral Large2具備128k上下文窗口,支持多達十種語言及80多種編程語言。
📈 在MMLU基準測試中實現84.0%的準確率,性能與成本表現卓越。
💻 用戶可通過La Plateforme訪問新模型,並在雲服務平臺上廣泛應用。
詳情鏈接:https://console.mistral.ai/
3、騰訊智影PC端推出“智能畫布”功能
騰訊智影PC端最近推出了一項新功能——“智能畫布”,爲用戶提供了多種實用的圖片編輯功能,結合AI繪畫技術,讓作圖變得更加輕鬆。這項功能特別適合需要對AI繪畫圖片進行再創作、摳圖、消除、擴圖等編輯操作的用戶。用戶現在可以登錄智影首頁,體驗這些新功能。
【AiBase提要:】
🎨 智能畫布結合AI繪畫技術,提供多種實用的圖片編輯功能,讓用戶輕鬆進行再創作、摳圖、消除、擴圖等操作。
🖌️ 用戶可以選擇畫布尺寸並上傳圖片,利用豐富的素材貼紙和工具進行編輯,還可進行AI創作。
🔍 智能畫布提供圖片AI調整功能,包括裁剪、摳圖、消除、擴圖、局部重繪、無損高清,滿足各種創意和專業需求。
4、金山辦公WPS AI上線“AI 伴寫”功能
金山辦公最近推出了WPS AI中的AI伴寫功能,旨在提升用戶寫作效率和質量。用戶可通過WPS Office界面啓用該功能,享受智能建議和續寫服務,輕鬆表達靈感。AI伴寫還提供多樣化的內容生成和中華詩詞引用支持,增強寫作連貫性。WPS AI2.0升級進一步推動了人工智能在辦公領域的應用。
【AiBase提要:】
✨ 提升寫作效率和質量,智能輔助用戶寫作
📚 多種場景角色滿足不同用戶的寫作需求
💡 提供智能建議、續寫服務和多樣化內容生成,支持中華詩詞引用
5、Stable Video4D橫空出世,一鍵讓你的視頻變身全景大片!
Stable Video4D是一款顛覆性的視頻處理工具,由Stability AI推出,能讓普通視頻變身爲八面玲瓏的全景大片。其快速生成多視角視頻,保持畫面一致性,將影響遊戲開發、視頻編輯和VR製作領域。未來或將改變觀影方式,帶來全新的互動式體驗。
【AiBase提要:】
🎥 Stable Video4D能讓普通視頻變身爲全景大片,展現多角度細節。
🔮 快速生成多視角視頻,保持畫面一致性,應用前景廣闊。
🌌 未來或將改變觀影方式,帶來全新的互動式體驗。
詳情鏈接:https://huggingface.co/stabilityai/sv4d
6、AI音樂生成工具Udio更新 V1.5模型音質提升顯著
昨晚,AI音樂生成工具Udio帶來了一系列令人矚目的更新,其中V1.5模型的音質得到顯著提升,爲音樂創作者提供更清晰豐富的聽覺體驗。新功能包括關鍵音調控制、多語言支持等,拓寬了用戶羣體。產品功能增強包括專屬創作頁面、下載音樂片段等,提供更個性化和高效的創作環境。
【AiBase提要:】
✨ V1.5模型音質顯著提升,提供更清晰豐富的聽覺體驗。
🎵 新功能包括關鍵音調控制和多語言支持,滿足創作者需求。
🔧 產品功能增強包括專屬創作頁面、下載音樂片段,提供更個性化和高效的創作環境。
詳情鏈接:https://top.aibase.com/tool/udio
7、媲美GPT-4o!復旦推語音模型SpeechGPT2能聽懂你的喜怒哀樂
SpeechGPT2是復旦大學研究團隊提出的一種創新的大型語言模型,具有跨模態的語音理解和生成能力。雖然展現出強大的任務執行能力,但仍存在噪聲魯棒性和音質穩定性方面的挑戰。團隊計劃未來開源技術報告、代碼和模型權重,以推動技術的進一步發展和完善。
【AiBase提要:】
🔑 SpeechGPT2是一種新型的大型語言模型,具有跨模態的語音理解和生成能力。
🔑 SpeechGPT2通過三階段訓練策略,包括模態適應預訓練、跨模態指令微調和模態鏈指令微調。
🔑 SpeechGPT2展現出強大的能力,在文本任務、跨模態任務和口語對話任務上表現出色。
詳情鏈接:https://top.aibase.com/tool/speechgpt2
8、Reddit開啓 “付費牆”,屏蔽搜索引擎和AI機器人隨意抓取內容
Reddit最近採取了引人注目的舉動,開始限制各大搜索引擎和AI機器人獲取其內容,需付費才能獲取。這一舉措導致除Google外的搜索引擎無法輕易訪問最新的Reddit內容,引發了廣泛關注和討論。
【AiBase提要:】
🌐 付費牆開啓: Reddit限制搜索引擎和AI機器人訪問內容,需付費才能獲取。
🤖 Google獨佔資源: 只有Google能通過“site:reddit.com”獲取最新結果,其他搜索引擎被排除。
💰 數據變現策略: Reddit加強數據保護,提升API費用,尋求新的收入來源以吸引投資者。
9、Nvidia AI推ChatQA2長文本理解和RAG能力媲美GPT-4
在人工智能的快速發展中,長文本上下文理解和檢索增強生成(RAG)的能力變得至關重要。Nvidia AI 的最新研究——ChatQA2模型,正是爲了應對這一挑戰而生。ChatQA2通過擴展上下文窗口和實施三階段指令調整過程,取得了與GPT-4-Turbo相媲美的長文本理解和RAG性能。
【AiBase提要:】
⚙️ ChatQA2通過將上下文窗口擴展到128K tokens,顯著提升了指令遵循能力和長文本理解。
🔍 ChatQA2在InfiniteBench評估中超越了GPT-4-Turbo,在多項任務上表現出全面能力。
💡 ChatQA2解決了RAG流程中的關鍵問題,提高了檢索的準確性和效率。
詳情鏈接:https://arxiv.org/abs/2407.14482
10、百川智能完成50億元A輪融資,估值達200億元
百川智能近期完成A輪融資,融資總額達50億元人民幣,估值攀升至200億元。這標誌着大模型初創公司取得了重要的資本支持,展現出行業發展的活力和潛力。
【AiBase提要:】
🚀 大模型初創公司百川智能完成50億元A輪融資,估值達200億元,吸引國資背景產業投資基金加入。
💡 百川智能在醫療AI領域表現突出,Baichuan3模型超越GPT-4,提出AI醫療的L0-L5分級發展路線。
💰 大模型行業融資格局變化,國資背景基金成爲重要資金來源,公司採取超級模型+超級應用雙輪驅動策略。
11、英偉達推出 Minitron 小型語言模型
英偉達最新推出的Minitron小型語言模型在人工智能領域引起轟動。這一系列模型訓練速度提高了40倍,通過修剪和知識蒸餾技術,大幅降低了訓練成本,並已開源在Huggingface上,推動AI技術普及。
【AiBase提要:】
📈 提升訓練速度: Minitron模型訓練速度比傳統模型快40倍,省時省力。
💡 節省成本: 通過修剪和知識蒸餾技術,降低訓練所需的計算資源和數據量。
🌍 開源共享: Minitron模型已在Huggingface上開源,促進更多人獲取和使用AI技術。
詳情鏈接:https://huggingface.co/collections/nvidia/minitron-669ac727dc9c86e6ab7f0f3e
12、OpenBuddy開源大語言模型團隊發佈Llama3.1-8B模型中文版
Meta最近發佈了新一代開源模型系列Llama3.1,其中包括一個405B參數的版本,其性能接近甚至在某些基準測試中超越了GPT-4等閉源模型。OpenBuddy利用Llama3.1-8B-Instruct模型,通過在少量中文數據上進行訓練,發佈了OpenBuddy-Llama3.1-8B-v22.1-131K,具備中文問答和跨語言翻譯能力。
【AiBase提要:】
🚀 Llama3.1-8B-Instruct是新一代開源模型,支持多語言且上下文長度高達131072tokens,展現出與GPT3.5Turbo相近的認知和推理能力。
🔍 OpenBuddy-Llama3.1-8B-v22.1-131K是具備中文問答和跨語言翻譯能力的新一代開源跨語言模型,展現出更強的認知潛力。
💡 OpenBuddy計劃對8B和70B模型進行更大規模的訓練,以增強模型的中文知識儲備、長文能力和認知能力,並探索微調405B模型的可能性。
詳情鏈接:https://modelscope.cn/models/OpenBuddy/openbuddy-llama3.1-8b-v22.1-131k
13、顛覆認知!AI自訓練9次崩潰 牛津劍橋發現AI潛藏致命弱點
這篇文章揭示了通過再訓練AI圖像生成模型使用自己生成的圖像可能導致模型崩潰的現象。研究人員發現,即使只包含少量自生成圖像在再訓練數據中,模型也會產生高度扭曲的圖像,難以完全恢復。這一發現提醒我們AI系統對數據“污染”非常敏感,需要謹慎處理。
【AiBase提要:】
⚠️ 再訓練AI模型使用自生成圖像可能導致模型崩潰,圖像質量急劇下降
🔍 模型崩潰不僅影響圖像質量,還導致生成的圖像缺乏多樣性
⚔️ 一旦模型被“污染”,恢復困難且可能是長期甚至不可逆的
詳情鏈接:https://arxiv.org/pdf/2311.12202