AI日報：新王誕生！Runway重磅發佈Gen-3 Alpha；Luma AI發佈Extend功能；DeepSeek又開源了一個模型；ElevenLabs可爲視頻自動配音

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、AI視頻王者迴歸！Runway全新Gen3模型又讓網友驚豔了一把

這篇文章介紹了Runway最近推出的新一代視頻生成模型Gen-3Alpha，該模型在保真度、一致性和動作表現方面有重大改進，爲構建通用世界模型邁出了重要一步。Gen-3Alpha具備多項顯著功能和特點，成爲創意產業中的新星。

【AiBase提要：】
⭐️ Gen-3Alpha在保真度、一致性和動作表現方面有顯著提升，能夠生成表達豐富的、逼真的人類角色
⭐️ Gen-3Alpha支持多種生成工具，如文本到視頻、圖像到視頻、文本到圖像轉換工具。
⭐️ 能夠進行精細時間控制，支持多種高級控制模式，包括運動畫筆、先進攝像頭控制和導演模式
⭐️ 極度穩定的光影，即便在高速移動的場景中也能保持高質量輸出。
更多視頻點此查看：https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA
官網地址：https://top.aibase.com/tool/gen-3-alpha

2、Luma AI發佈了 Extend 功能視頻時長擴充到10秒以上

Luma AI最近更新了Dream Machine視頻模型，新增了Extend功能，可以將視頻時長擴充到10秒以上，並保持原視頻風格、人物對象一致。雖然Extend功能生成延長視頻耗時較長，但風格一致性保持得很好。

【AiBase提要:】
✨ Dream Machine升級發佈Extend功能，視頻時長可達10秒以上，保持原視頻風格與對象一致。
⏱️ 使用Extend功能延長視頻耗時較長，但風格一致性良好。
🔗 詳情：https://www.chinaz.com/ainews/9639.shtml

3、DeepSeek發佈開源模型DeepSeek-Coder-V2

DeepSeek最近發佈了開源模型DeepSeek-Coder-V2，該模型在代碼和數學能力方面超越了GPT-4-Turbo，具有全球領先的性能。模型採用MoE架構，支持多語言和更長的上下文處理長度。用戶可免費商用，無需申請。

【AiBase提要:】
🚀 模型性能全球領先，特別擅長代碼生成和數學算術。
💡 支持338種編程語言和128K上下文長度，滿足更多開發需求。
🔗 提供API服務，價格與DeepSeek-V2一致，在基準測試中表現優異。
詳情鏈接:https://top.aibase.com/tool/deepseek-coder-v2

4、Adobe Acrobat迎來重大AI升級支持多文檔分析和圖像生成

Adobe即將推出一系列重磅AI升級，提升Acrobat的AI助手功能、圖像生成能力，保證數據隱私保護。這次更新將極大提升辦公效率，爲處理大量文檔和優化視覺內容帶來便利。

QQ截圖20240618092653.png

【AiBase提要:】
🚀 AI助手功能升級，支持多文檔分析和查詢，提升用戶體驗。
🖼️ 新增AI圖像生成器，用戶可生成全新圖像或編輯現有PDF中的圖像。
🔒 數據隱私保護承諾，文檔上傳至雲端分析但不用於訓練AI模型，禁止第三方利用。

5、蘋果在Hugging Face平臺發佈20個Core ML模型

蘋果在Hugging Face平臺發佈了20個新的Core ML模型和4個數據集，展示了其在推動AI發展方面的重大進展。這次更新不僅包括着眼於文本和圖像的令人振奮的新模型，還涵蓋了廣泛的應用，如圖像分類、單目深度估計和語義分割。蘋果強調了設備AI的重要性，通過在用戶設備上運行優化的模型，提升了應用程序性能，同時保障用戶數據安全和隱私。

【AiBase提要:】
🚀 蘋果在Hugging Face平臺發佈了20個新的Core ML模型和4個數據集，推動AI發展。
💡 新發布的Core ML模型涵蓋了廣泛的應用，包括圖像分類、單目深度估計和語義分割。
🔒 蘋果強調設備AI的重要性，優化的模型在用戶設備上運行，提升應用程序性能並保障用戶數據安全和隱私。
詳情鏈接:https://huggingface.co/apple

6、ElevenLabs開源視頻生成音效工具上傳視頻即可自動配音

ElevenLabs是一家專注於音頻生成技術的公司，最近宣佈涉足視頻生成領域，開源了一個項目可以自動爲上傳的視頻配音，生成合適的音效。他們推出了新功能，用戶可以通過輸入文本生成各種逼真的音樂特效，爲電影、遊戲、短視頻等行業帶來巨大幫助。除音效生成外，還提供語音克隆和文本轉語音等強大功能。

【AiBase提要:】
🔊 自動爲上傳視頻配音，生成合適音效
🎶 輸入文本生成各種逼真音樂特效，幫助電影、遊戲、短視頻行業
🎤 提供語音克隆和文本轉語音功能，賦予內容更生動表現形式
文本轉音頻入口：https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
視頻自動配音入口：https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api

7、騰訊微信視頻號擬限制數字人帶貨

騰訊視頻號近日宣佈了對《視頻號櫥窗達人發佈低質量內容實施細則》的修訂，旨在加強內容質量監管，並擬禁止數字人直播帶貨。該修訂於今年 6 月 7 日至 6 月 13 日公開徵集意見。

【AiBase提要：】
⭐ 修訂細則旨在加強視頻號內容質量監管
⭐ 禁止數字人直播帶貨，明確禁止非真實直播內容
⭐ 平臺將對違規者採取相應處罰措施
詳情：https://www.chinaz.com/2024/0618/1624007.shtml

8、Stability AI的SD3因許可問題遭反對，CivitAI社區封禁相關內容

Stability AI最新發佈的重大模型SD3因許可問題引發爭議，面臨AI社區反對。CivitAI社區封禁與SD3相關內容，引發許可協議爭議。公司推出面向消費者的創作者許可，限制開發者條件和圖像生成數量。SD3存在無法生成特定人體姿勢等問題，未來不確定。CEO離職裁員，公司需解釋新許可協議影響。整個爭議對AI社區和開源模型發展有潛在影響。

【AiBase提要:】
💥 SD3許可問題引發爭議，面臨AI社區反對。
🔒 公司推出創作者許可，限制開發者條件和圖像生成數量。
❓ SD3存在無法生成特定人體姿勢等問題，未來不確定。

9、樂高打印機Pixelbot 3000

這篇文章介紹了YouTube頻道創作者@Creative Mindstorms設計製造的Pixelbot3000樂高打印機，利用自定義代碼和人工智能生成樂高馬賽克。用戶只需輸入藝術作品名稱，AI生成圖像後Pixelbot3000自動組裝馬賽克。

【AiBase提要:】
🤖 利用自定義代碼和人工智能，Pixelbot3000能夠自動生成樂高馬賽克，簡化了打印過程。
🎨 Pixelbot3000使用OpenAI的DALL-E3生成卡通風格簡化圖像，最終產生高對比度的縮放圖像。
🔧 Pixelbot3000通過分割AI生成的圖像並採樣每個方格中心像素的顏色，得到更好的馬賽克圖案。

10、研究人員教會 AI 識別人類線描的草圖

這篇文章介紹了薩里大學和斯坦福大學研究團隊開發的新方法，教會人工智能理解人類線描草圖的重要性和成果。通過結合草圖和文字描述，人工智能展現出接近人類水平的理解能力，對複雜場景中的對象進行準確識別和標記。這一研究爲人機交互和設計工作流程帶來了新的可能性。

【AiBase提要:】
🧠 人工智能學習理解草圖的重要性，展現出接近人類水平的表現
🌳 人工智能能以85%準確度識別和標記風箏、樹、長頸鹿等對象，超越其他模型
🎨 新方法不僅適用於非藝術家繪製的草圖，還適用於沒有明確訓練的對象繪製的草圖
詳情鏈接:https://arxiv.org/abs/2312.12463

11、研究：AI生成圖像未能準確呈現伊斯蘭建築文化細微差異

人工智能（AI）在建築設計領域帶來革命性變革，但在伊斯蘭建築等文化敏感領域，AI生成的圖像未能正確呈現歷史元素。研究指出AI生成器存在歷史知識不足，建議謹慎使用。作者認爲AI可成爲有價值工具，但需結合人類專業知識和文化敏感度。

【AiBase提要:】
🏗️ AI在建築設計中革命性變革，但在伊斯蘭建築領域存在挑戰。
🕌 AI生成器歷史知識不足，未能準確呈現伊斯蘭建築文化細節。
🤖 AI應作爲增強人類創造力的工具，結合專業知識和文化敏感度。

AI日報：新王誕生！Runway重磅發佈Gen-3 Alpha；Luma AI發佈Extend功能；DeepSeek又開源了一個模型；ElevenLabs可爲視頻自動配音

相關推薦

Runway發佈通用世界模型GWM-1，用像素預測構建可推理的虛擬世界

Runway 發佈全新 Gen-4.5視頻生成模型，提升創作與視覺質量

120 人團隊把萬億巨頭拉下馬：Runway Gen-4.5 盲測奪冠，正式宣戰谷歌與 OpenAI

AI視頻落地垂直領域!Runway開放模型微調權限，聚焦機器人與建築業

Luma與Runway瞄準機器人與自動駕駛，拓展未來營收版圖