歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://top.aibase.com/

1、AI視頻王者迴歸!Runway全新Gen3模型又讓網友驚豔了一把

這篇文章介紹了Runway最近推出的新一代視頻生成模型Gen-3Alpha,該模型在保真度、一致性和動作表現方面有重大改進,爲構建通用世界模型邁出了重要一步。Gen-3Alpha具備多項顯著功能和特點,成爲創意產業中的新星。

【AiBase提要:】

⭐️ Gen-3Alpha在保真度、一致性和動作表現方面有顯著提升,能夠生成表達豐富的、逼真的人類角色

⭐️ Gen-3Alpha支持多種生成工具,如文本到視頻、圖像到視頻、文本到圖像轉換工具。

⭐️ 能夠進行精細時間控制,支持多種高級控制模式,包括運動畫筆、先進攝像頭控制和導演模式

⭐️ 極度穩定的光影,即便在高速移動的場景中也能保持高質量輸出。

更多視頻點此查看:https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA

官網地址:https://top.aibase.com/tool/gen-3-alpha

2、Luma AI發佈了 Extend 功能 視頻時長擴充到10秒以上

Luma AI最近更新了Dream Machine視頻模型,新增了Extend功能,可以將視頻時長擴充到10秒以上,並保持原視頻風格、人物對象一致。雖然Extend功能生成延長視頻耗時較長,但風格一致性保持得很好。

【AiBase提要:】

✨ Dream Machine升級發佈Extend功能,視頻時長可達10秒以上,保持原視頻風格與對象一致。

⏱️ 使用Extend功能延長視頻耗時較長,但風格一致性良好。

🔗 詳情:https://www.chinaz.com/ainews/9639.shtml

3、DeepSeek發佈開源模型DeepSeek-Coder-V2

DeepSeek最近發佈了開源模型DeepSeek-Coder-V2,該模型在代碼和數學能力方面超越了GPT-4-Turbo,具有全球領先的性能。模型採用MoE架構,支持多語言和更長的上下文處理長度。用戶可免費商用,無需申請。

image.png

【AiBase提要:】

🚀 模型性能全球領先,特別擅長代碼生成和數學算術。

💡 支持338種編程語言和128K上下文長度,滿足更多開發需求。

🔗 提供API服務,價格與DeepSeek-V2一致,在基準測試中表現優異。

詳情鏈接:https://top.aibase.com/tool/deepseek-coder-v2

4、Adobe Acrobat迎來重大AI升級 支持多文檔分析和圖像生成

Adobe即將推出一系列重磅AI升級,提升Acrobat的AI助手功能、圖像生成能力,保證數據隱私保護。這次更新將極大提升辦公效率,爲處理大量文檔和優化視覺內容帶來便利。

QQ截圖20240618092653.png

【AiBase提要:】

🚀 AI助手功能升級,支持多文檔分析和查詢,提升用戶體驗。

🖼️ 新增AI圖像生成器,用戶可生成全新圖像或編輯現有PDF中的圖像。

🔒 數據隱私保護承諾,文檔上傳至雲端分析但不用於訓練AI模型,禁止第三方利用。

5、蘋果在Hugging Face平臺發佈20個Core ML模型

蘋果在Hugging Face平臺發佈了20個新的Core ML模型和4個數據集,展示了其在推動AI發展方面的重大進展。這次更新不僅包括着眼於文本和圖像的令人振奮的新模型,還涵蓋了廣泛的應用,如圖像分類、單目深度估計和語義分割。蘋果強調了設備AI的重要性,通過在用戶設備上運行優化的模型,提升了應用程序性能,同時保障用戶數據安全和隱私。

image.png


【AiBase提要:】

🚀 蘋果在Hugging Face平臺發佈了20個新的Core ML模型和4個數據集,推動AI發展。

💡 新發布的Core ML模型涵蓋了廣泛的應用,包括圖像分類、單目深度估計和語義分割。

🔒 蘋果強調設備AI的重要性,優化的模型在用戶設備上運行,提升應用程序性能並保障用戶數據安全和隱私。

詳情鏈接:https://huggingface.co/apple

6、ElevenLabs開源視頻生成音效工具 上傳視頻即可自動配音

ElevenLabs是一家專注於音頻生成技術的公司,最近宣佈涉足視頻生成領域,開源了一個項目可以自動爲上傳的視頻配音,生成合適的音效。他們推出了新功能,用戶可以通過輸入文本生成各種逼真的音樂特效,爲電影、遊戲、短視頻等行業帶來巨大幫助。除音效生成外,還提供語音克隆和文本轉語音等強大功能。

【AiBase提要:】

🔊 自動爲上傳視頻配音,生成合適音效

🎶 輸入文本生成各種逼真音樂特效,幫助電影、遊戲、短視頻行業

🎤 提供語音克隆和文本轉語音功能,賦予內容更生動表現形式

文本轉音頻入口:https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi

視頻自動配音入口:https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api


7、騰訊微信視頻號擬限制數字人帶貨

騰訊視頻號近日宣佈了對《視頻號櫥窗達人發佈低質量內容實施細則》的修訂,旨在加強內容質量監管,並擬禁止數字人直播帶貨。該修訂於今年 6 月 7 日至 6 月 13 日公開徵集意見。

【AiBase提要:】

⭐ 修訂細則旨在加強視頻號內容質量監管

⭐ 禁止數字人直播帶貨,明確禁止非真實直播內容

⭐ 平臺將對違規者採取相應處罰措施

詳情:https://www.chinaz.com/2024/0618/1624007.shtml

8、Stability AI的SD3因許可問題遭反對,CivitAI社區封禁相關內容

Stability AI最新發佈的重大模型SD3因許可問題引發爭議,面臨AI社區反對。CivitAI社區封禁與SD3相關內容,引發許可協議爭議。公司推出面向消費者的創作者許可,限制開發者條件和圖像生成數量。SD3存在無法生成特定人體姿勢等問題,未來不確定。CEO離職裁員,公司需解釋新許可協議影響。整個爭議對AI社區和開源模型發展有潛在影響。

【AiBase提要:】

💥 SD3許可問題引發爭議,面臨AI社區反對。

🔒 公司推出創作者許可,限制開發者條件和圖像生成數量。

❓ SD3存在無法生成特定人體姿勢等問題,未來不確定。

9、樂高打印機Pixelbot 3000

這篇文章介紹了YouTube頻道創作者@Creative Mindstorms設計製造的Pixelbot3000樂高打印機,利用自定義代碼和人工智能生成樂高馬賽克。用戶只需輸入藝術作品名稱,AI生成圖像後Pixelbot3000自動組裝馬賽克。

image.png

【AiBase提要:】

🤖 利用自定義代碼和人工智能,Pixelbot3000能夠自動生成樂高馬賽克,簡化了打印過程。

🎨 Pixelbot3000使用OpenAI的DALL-E3生成卡通風格簡化圖像,最終產生高對比度的縮放圖像。

🔧 Pixelbot3000通過分割AI生成的圖像並採樣每個方格中心像素的顏色,得到更好的馬賽克圖案。

10、研究人員教會 AI 識別人類線描的草圖

這篇文章介紹了薩里大學和斯坦福大學研究團隊開發的新方法,教會人工智能理解人類線描草圖的重要性和成果。通過結合草圖和文字描述,人工智能展現出接近人類水平的理解能力,對複雜場景中的對象進行準確識別和標記。這一研究爲人機交互和設計工作流程帶來了新的可能性。

image.png

【AiBase提要:】

🧠 人工智能學習理解草圖的重要性,展現出接近人類水平的表現

🌳 人工智能能以85%準確度識別和標記風箏、樹、長頸鹿等對象,超越其他模型

🎨 新方法不僅適用於非藝術家繪製的草圖,還適用於沒有明確訓練的對象繪製的草圖

詳情鏈接:https://arxiv.org/abs/2312.12463

11、研究:AI生成圖像未能準確呈現伊斯蘭建築文化細微差異

人工智能(AI)在建築設計領域帶來革命性變革,但在伊斯蘭建築等文化敏感領域,AI生成的圖像未能正確呈現歷史元素。研究指出AI生成器存在歷史知識不足,建議謹慎使用。作者認爲AI可成爲有價值工具,但需結合人類專業知識和文化敏感度。

image.png

【AiBase提要:】

🏗️ AI在建築設計中革命性變革,但在伊斯蘭建築領域存在挑戰。

🕌 AI生成器歷史知識不足,未能準確呈現伊斯蘭建築文化細節。

🤖 AI應作爲增強人類創造力的工具,結合專業知識和文化敏感度。