歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、AI視頻王者迴歸!Runway全新Gen3模型又讓網友驚豔了一把
這篇文章介紹了Runway最近推出的新一代視頻生成模型Gen-3Alpha,該模型在保真度、一致性和動作表現方面有重大改進,爲構建通用世界模型邁出了重要一步。Gen-3Alpha具備多項顯著功能和特點,成爲創意產業中的新星。
【AiBase提要:】
⭐️ Gen-3Alpha在保真度、一致性和動作表現方面有顯著提升,能夠生成表達豐富的、逼真的人類角色
⭐️ Gen-3Alpha支持多種生成工具,如文本到視頻、圖像到視頻、文本到圖像轉換工具。
⭐️ 能夠進行精細時間控制,支持多種高級控制模式,包括運動畫筆、先進攝像頭控制和導演模式
⭐️ 極度穩定的光影,即便在高速移動的場景中也能保持高質量輸出。
更多視頻點此查看:https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA
官網地址:https://top.aibase.com/tool/gen-3-alpha
2、Luma AI發佈了 Extend 功能 視頻時長擴充到10秒以上
Luma AI最近更新了Dream Machine視頻模型,新增了Extend功能,可以將視頻時長擴充到10秒以上,並保持原視頻風格、人物對象一致。雖然Extend功能生成延長視頻耗時較長,但風格一致性保持得很好。
【AiBase提要:】
✨ Dream Machine升級發佈Extend功能,視頻時長可達10秒以上,保持原視頻風格與對象一致。
⏱️ 使用Extend功能延長視頻耗時較長,但風格一致性良好。
🔗 詳情:https://www.chinaz.com/ainews/9639.shtml
3、DeepSeek發佈開源模型DeepSeek-Coder-V2
DeepSeek最近發佈了開源模型DeepSeek-Coder-V2,該模型在代碼和數學能力方面超越了GPT-4-Turbo,具有全球領先的性能。模型採用MoE架構,支持多語言和更長的上下文處理長度。用戶可免費商用,無需申請。
【AiBase提要:】
🚀 模型性能全球領先,特別擅長代碼生成和數學算術。
💡 支持338種編程語言和128K上下文長度,滿足更多開發需求。
🔗 提供API服務,價格與DeepSeek-V2一致,在基準測試中表現優異。
詳情鏈接:https://top.aibase.com/tool/deepseek-coder-v2
4、Adobe Acrobat迎來重大AI升級 支持多文檔分析和圖像生成
Adobe即將推出一系列重磅AI升級,提升Acrobat的AI助手功能、圖像生成能力,保證數據隱私保護。這次更新將極大提升辦公效率,爲處理大量文檔和優化視覺內容帶來便利。
【AiBase提要:】
🚀 AI助手功能升級,支持多文檔分析和查詢,提升用戶體驗。
🖼️ 新增AI圖像生成器,用戶可生成全新圖像或編輯現有PDF中的圖像。
🔒 數據隱私保護承諾,文檔上傳至雲端分析但不用於訓練AI模型,禁止第三方利用。
5、蘋果在Hugging Face平臺發佈20個Core ML模型
蘋果在Hugging Face平臺發佈了20個新的Core ML模型和4個數據集,展示了其在推動AI發展方面的重大進展。這次更新不僅包括着眼於文本和圖像的令人振奮的新模型,還涵蓋了廣泛的應用,如圖像分類、單目深度估計和語義分割。蘋果強調了設備AI的重要性,通過在用戶設備上運行優化的模型,提升了應用程序性能,同時保障用戶數據安全和隱私。
【AiBase提要:】
🚀 蘋果在Hugging Face平臺發佈了20個新的Core ML模型和4個數據集,推動AI發展。
💡 新發布的Core ML模型涵蓋了廣泛的應用,包括圖像分類、單目深度估計和語義分割。
🔒 蘋果強調設備AI的重要性,優化的模型在用戶設備上運行,提升應用程序性能並保障用戶數據安全和隱私。
詳情鏈接:https://huggingface.co/apple
6、ElevenLabs開源視頻生成音效工具 上傳視頻即可自動配音
ElevenLabs是一家專注於音頻生成技術的公司,最近宣佈涉足視頻生成領域,開源了一個項目可以自動爲上傳的視頻配音,生成合適的音效。他們推出了新功能,用戶可以通過輸入文本生成各種逼真的音樂特效,爲電影、遊戲、短視頻等行業帶來巨大幫助。除音效生成外,還提供語音克隆和文本轉語音等強大功能。
【AiBase提要:】
🔊 自動爲上傳視頻配音,生成合適音效
🎶 輸入文本生成各種逼真音樂特效,幫助電影、遊戲、短視頻行業
🎤 提供語音克隆和文本轉語音功能,賦予內容更生動表現形式
文本轉音頻入口:https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
視頻自動配音入口:https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api
7、騰訊微信視頻號擬限制數字人帶貨
騰訊視頻號近日宣佈了對《視頻號櫥窗達人發佈低質量內容實施細則》的修訂,旨在加強內容質量監管,並擬禁止數字人直播帶貨。該修訂於今年 6 月 7 日至 6 月 13 日公開徵集意見。
【AiBase提要:】
⭐ 修訂細則旨在加強視頻號內容質量監管
⭐ 禁止數字人直播帶貨,明確禁止非真實直播內容
⭐ 平臺將對違規者採取相應處罰措施
詳情:https://www.chinaz.com/2024/0618/1624007.shtml
8、Stability AI的SD3因許可問題遭反對,CivitAI社區封禁相關內容
Stability AI最新發佈的重大模型SD3因許可問題引發爭議,面臨AI社區反對。CivitAI社區封禁與SD3相關內容,引發許可協議爭議。公司推出面向消費者的創作者許可,限制開發者條件和圖像生成數量。SD3存在無法生成特定人體姿勢等問題,未來不確定。CEO離職裁員,公司需解釋新許可協議影響。整個爭議對AI社區和開源模型發展有潛在影響。
【AiBase提要:】
💥 SD3許可問題引發爭議,面臨AI社區反對。
🔒 公司推出創作者許可,限制開發者條件和圖像生成數量。
❓ SD3存在無法生成特定人體姿勢等問題,未來不確定。
9、樂高打印機Pixelbot 3000
這篇文章介紹了YouTube頻道創作者@Creative Mindstorms設計製造的Pixelbot3000樂高打印機,利用自定義代碼和人工智能生成樂高馬賽克。用戶只需輸入藝術作品名稱,AI生成圖像後Pixelbot3000自動組裝馬賽克。
【AiBase提要:】
🤖 利用自定義代碼和人工智能,Pixelbot3000能夠自動生成樂高馬賽克,簡化了打印過程。
🎨 Pixelbot3000使用OpenAI的DALL-E3生成卡通風格簡化圖像,最終產生高對比度的縮放圖像。
🔧 Pixelbot3000通過分割AI生成的圖像並採樣每個方格中心像素的顏色,得到更好的馬賽克圖案。
10、研究人員教會 AI 識別人類線描的草圖
這篇文章介紹了薩里大學和斯坦福大學研究團隊開發的新方法,教會人工智能理解人類線描草圖的重要性和成果。通過結合草圖和文字描述,人工智能展現出接近人類水平的理解能力,對複雜場景中的對象進行準確識別和標記。這一研究爲人機交互和設計工作流程帶來了新的可能性。
【AiBase提要:】
🧠 人工智能學習理解草圖的重要性,展現出接近人類水平的表現
🌳 人工智能能以85%準確度識別和標記風箏、樹、長頸鹿等對象,超越其他模型
🎨 新方法不僅適用於非藝術家繪製的草圖,還適用於沒有明確訓練的對象繪製的草圖
詳情鏈接:https://arxiv.org/abs/2312.12463
11、研究:AI生成圖像未能準確呈現伊斯蘭建築文化細微差異
人工智能(AI)在建築設計領域帶來革命性變革,但在伊斯蘭建築等文化敏感領域,AI生成的圖像未能正確呈現歷史元素。研究指出AI生成器存在歷史知識不足,建議謹慎使用。作者認爲AI可成爲有價值工具,但需結合人類專業知識和文化敏感度。
【AiBase提要:】
🏗️ AI在建築設計中革命性變革,但在伊斯蘭建築領域存在挑戰。
🕌 AI生成器歷史知識不足,未能準確呈現伊斯蘭建築文化細節。
🤖 AI應作爲增強人類創造力的工具,結合專業知識和文化敏感度。