歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、最強開源模型來了!Llama3.1以405B參數領先GPT-4o
在人工智能的世界裏,開源與閉源的較量從未停歇。Meta AI的Llama3.1模型的發佈標誌着開源AI走向成熟,預示着一個全新的時代即將到來。Llama3.1表現超越閉源模型,在性能上與閉源模型並駕齊驅,開啓了開源AI可能成爲行業標準的新時代。

【AiBase提要:】
🚀 Llama3.1以405B參數領先GPT-4o和Claude3.5Sonnet,在性能上實現超越。
💡 Meta大幅優化訓練棧,擴展模型算力規模至16000個H100GPU,提高性能。
🔍 Llama3.1具有上下文長度擴展、多語言支持和卓越性能等技術亮點,展現出在多方面的優勢。
詳情鏈接:https://ai.meta.com/blog/meta-llama-3-1/
2、可靈AI視頻開啓付費計劃 結束免費生成體驗
可靈宣佈結束免費生成體驗,推出多層次付費會員計劃,爲用戶提供更多樣化的服務選擇。新會員體系包括非會員、黃金會員、鉑金會員和鑽石會員,享受限時五折優惠。可靈定價親民,性價比高,滿足不同用戶需求。轉變商業模式展現成熟,將在AI視頻生成領域發揮重要作用。

【AiBase提要:】
🔑 可靈推出多層次付費會員計劃,包括非會員、黃金會員、鉑金會員和鑽石會員。
💡 限時五折優惠活動,各會員方案價格實惠,鉑金會員每月平均133元可生成300個視頻。
💼 可靈保留每日66點免費點數政策,滿足日常用戶創作需求。
詳情鏈接:https://top.aibase.com/tool/keling-ai
3、快手AI視頻產品可靈國際版1.0上線
快手今日宣佈,其AI視頻產品可靈國際版1.0正式上線,用戶無需中國手機號碼,每日登錄可獲得66個免費積分,引發全球熱烈反響。可靈迅速崛起,改變AI視頻格局,被視爲國產AI模型向國際市場進軍的重要一步。付費用戶體驗提升,定價合理,保持競爭力。

【AiBase提要:】
🌐 可靈國際版1.0正式上線,用戶無需中國手機號碼,每日登錄獲得66個免費積分。
🚀 可靈迅速崛起,吸引超50萬用戶申請內測資格,展示巨大市場潛力。
💰 可靈定價合理,月費最低33元人民幣,支持生成66條短視頻,去除水印,保持競爭力。
詳情鏈接:https://klingai.com
4、AI視頻編輯神器Vozo 可使用提示重寫腳本並重新配音
Vozo是一款顛覆性的視頻編輯工具,利用人工智能技術徹底改變了內容創作方式。它通過智能視頻重寫與重配音、文本驅動的語音編輯、多角色口型同步等功能,爲用戶提供了前所未有的視頻編輯和改編能力。同時,Vozo支持專業視頻翻譯和自動視頻優化,極大地簡化了內容的國際化過程。
【AiBase提要:】
✨ 智能視頻重寫與重配音:Vozo利用AI技術,能快速將經典視頻轉化爲病毒營銷視頻,且僅需幾秒鐘即可完成。
🎙 文本驅動的語音編輯:用戶可以通過編輯文本來修改視頻解說,系統提供多種口音和語調選項,提高視頻內容的表現力。
👥 多角色口型同步:Vozo能爲視頻中的多個角色實現自然流暢的口型同步,提升了觀看體驗。
詳情鏈接:https://top.aibase.com/tool/vozo
5、PixVerse V2視頻模型發佈 支持直接生成8秒視頻
PixVerse發佈了V2版本的視頻模型,可以直接生成長達8秒的視頻,提升了畫質和細節。這款工具讓用戶的創意無限,細節控制精準,連貫性強,場景豐富。操作簡單,滿足各種風格需求,讓用戶在8秒內創造一個世界。
【AiBase提要:】
✨ 支持生成長達8秒的視頻,提升畫質和細節。
🎥 創意無限,可拍攝外星人跳廣場舞、恐龍騎自行車等場景。
🌍 操作簡單,滿足各種風格需求,讓用戶在8秒內創造多個場景。
詳情鏈接:https://top.aibase.com/tool/pixverse
6、騰訊PhotoMaker V2升級 幾秒鐘完成個性人物圖像定製 無需訓練LoRA
騰訊近日發佈了PhotoMaker V2版本,革命性提升AI個性化人物圖像定製效率和質量。通過ID嵌入技術,實現快速高質量個性化圖像生成,無需繁瑣訓練過程。提升圖像ID真實度,增強用戶生成控制能力,效率提升近4倍。開啓個人用戶和專業創作者新可能性,簡化個性化圖像內容創作過程。AI技術進步將改變創意產業,催生新藝術表現形式和商業模式。
【AiBase提要:】
🚀 創新ID嵌入技術實現快速高質量個性化圖像生成,無需繁瑣訓練過程。
💡 提升圖像ID真實度,增強用戶生成控制能力,效率提升近4倍。
🎨 開啓個人用戶和專業創作者新可能性,簡化個性化圖像內容創作過程。
詳情鏈接:https://top.aibase.com/tool/photomaker-v2
7、北大出品新3D場景生成框架HoloDreamer
HoloDreamer是一款新型的3D場景生成框架,通過用戶的文本描述生成身臨其境、完整的3D場景。這一創新性進展將推動文本驅動的3D場景生成研究,爲虛擬現實、遊戲和影視行業提供新的解決方案。

【AiBase提要:】
🌟 HoloDreamer是一款新型的3D場景生成框架,通過文本描述生成完整的3D場景。
🖼️ 框架包括兩個核心模塊: 風格化全景生成和增強型全景重建,確保生成結果的高質量和一致性。
🚀 HoloDreamer在實驗中表現優異,超越了之前的3D生成方法,爲虛擬現實和遊戲等領域提供了新的解決方案。
8、Adobe爲Illustrator和Photoshop引入更多生成式AI功能
Adobe最近推出了新一輪的生成式AI功能,旨在提升設計軟件Illustrator和Photoshop的創作流程效率。這些更新包括Illustrator的生成式形狀填充工具和Photoshop的圖像生成功能,爲設計師提供更多創作自由和便利。儘管引發了部分創意專業人士的擔憂,Adobe強調生成式AI的目的是增強創意表達而非取代人類創意。這一系列更新是Adobe自去年推出Firefly模型以來的最新成果,希望爲創意行業帶來更多創新機會。

【AiBase提要:】
✨ Illustrator新增生成式形狀填充工具,可通過描述性文本填充形狀;Text to Pattern功能生成可擴展的自定義矢量圖案。
🖼️ Photoshop更新引入生成圖像功能,支持更高的圖像細節增強;提供新的選擇畫筆工具,方便用戶選擇和分離特定對象。
🔍 儘管Adobe強調生成式AI旨在增強創意表達,仍面臨部分創意專業人士對自動化設計可能減少就業機會的質疑。
9、快手:添加AIGC內容“作者聲明”不會影響作品流量
快手平臺推出了新功能“作者聲明”,鼓勵創作者在發佈AI生成內容時添加聲明,以減少誤解。創作者需遵循操作引導手冊,可通過作者聲明標註AI生成內容。添加聲明不影響作品流量,除非違反法律或規則。更新快手app至最新版本可解決標識操作入口問題。快手希望與創作者合作,共同打造真實有趣社區環境。

【AiBase提要:】
🚀 創作者可在發佈AI生成內容時添加作者聲明
💡 添加聲明不影響作品流量,除非違規
🔧 更新快手app至最新版本可解決標識操作入口問題
10、快手可靈團隊開源項目LivePortrait爆火 一張照片生成動態視頻 大叔秒變少女!
快手可靈團隊開源的人像視頻生成框架LivePortrait在人工智能領域引起轟動,展現了AI技術在視頻生成領域的巨大潛力。該項目在GitHub上已獲得7.5K星標,成爲當下最熱門的AI項目之一。LivePortrait不僅能讓靜態圖像動起來,還能精確複製表情到不同人身上,具有廣泛的應用價值。
【AiBase提要:】
🔥 LivePortrait在GitHub上獲得7.5K星標,成爲熱門AI項目
💡 LivePortrait能精確複製表情到不同人身上,適用於多種風格
⚙️ LivePortrait生成速度高達12.8毫秒每幀,在視頻生成領域具有優勢
詳情鏈接:https://top.aibase.com/tool/liveportrait
11、百川智能聯合天津大學推出“Sibyl System”Agent框架 登頂大模型複雜任務榜單GAIA
百川智能與天津大學合作推出的Sibyl System智能體框架在GAIA Leader Board上取得第一名成績,突顯其在複雜任務執行方面的卓越能力。GAIA評測方案揭示了現有模型的能力缺陷,爲模型研發提供改進方向,要求AI具備推理、多模態理解、網頁瀏覽和使用工具等能力。Sibyl System框架設計特點包括類人的瀏覽器界面替代檢索、問答替代對話、引入“陪審團”機制等,實現了模型從“快思考”到“慢思考”的轉變。
【AiBase提要:】
✨ Sibyl System在GAIA Leader Board上取得第一名,展現出在複雜任務執行方面的卓越能力
⚙️ GAIA評測方案揭示現有模型的能力缺陷,爲模型研發提供改進方向
🔍 Sibyl System框架設計特點包括類人瀏覽器界面替代檢索、問答替代對話、引入“陪審團”機制
詳情鏈接:https://arxiv.org/pdf/2407.10718
12、微軟VALLE-2模型實現零樣本文本到語音技術
微軟發佈的VALLE-2模型實現了與人類同等水平的語音合成,被認爲是TTS領域的里程碑式進展。該模型展現了驚人的即時模仿能力,提高了解碼穩定性,加速了推理過程,簡化了數據需求,超越了前代模型VALLE,引發了關於技術倫理和責任使用的深度思考。
【AiBase提要:】
🌟 零樣本學習:VALLE-2僅需一段簡短的陌生語音樣本,展現了驚人的即時模仿能力。
🔬 重複感知採樣:改進了隨機採樣方法,提高了解碼穩定性。
🚀 分組代碼建模:減少了序列長度,加速了推理過程,同時提高了性能。
詳情鏈接:https://www.microsoft.com/en-us/research/project/vall-e-x/vall-e-2/
13、LazyLLM: 提高LLM長文本推理效率
LazyLLM是一項由蘋果公司和Meta AI聯合推出的新技術,旨在提高大型語言模型在長文本推理中的效率。該技術通過動態選擇重要token來加速LLM推理過程,在長文本場景中表現突出。LazyLLM不需要對現有模型進行改動,易於實施,同時能顯著提高推理速度,保持較高的準確性。

【AiBase提要:】
🌟 LazyLLM通過動態選擇重要token,加速LLM推理過程,在長文本場景中表現突出。
⚡ 該技術能夠顯著提高推理速度,TTFT速度提升可達4.77倍,同時保持較高的準確性。
🔧 LazyLLM不需要對現有模型進行改動,可與任何變換器基礎的LLM兼容,易於實施。
詳情鏈接:https://arxiv.org/abs/2407.14057
14、谷歌二季度收入達850億美元,AI與搜索業務助力增長
谷歌在第二季度取得了令人矚目的成績,收入達到850億美元。其搜索業務和雲計算部門表現突出,AI技術的應用也取得了顯著進展。此外,谷歌放棄了逐步淘汰第三方Cookie的計劃,轉而推行用戶知情選擇政策。整體業務增長勢頭良好,展望未來發展潛力巨大。

【AiBase提要:】
💰 谷歌第二季度收入達850億美元,搜索業務貢獻485億美元。
🤖 生成式AI解決方案爲谷歌雲計算帶來數十億收入,開發者使用人數超過200萬。
🔍 谷歌放棄逐步淘汰第三方Cookie,Chrome將要求用戶做出“知情選擇”。
