歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品 點擊瞭解:https://top.aibase.com/
🤖📱💼AI應用
Sora平替?2分鐘超長AI視頻模型StreamingT2V免費開源 試玩地址公佈

【AiBase提要:】
⭐ StreamingT2V可以生成長達1200幀、時長2分鐘的視頻,超越了Sora模型
⭐ 採用先進的自迴歸技術,保持視頻時間一致性和高質量
⭐ 它是一個免費開源的項目,可以無縫兼容SVD和animatediff等模型
⭐ 代碼已發佈,試玩地址也已上線。生成時間較久,一個視頻預計要生成13分鐘以上。
開源代碼:https://top.aibase.com/tool/streamingt2v
論文地址:https://arxiv.org/pdf/2403.14773.pdf
試玩地址1:https://huggingface.co/spaces/PAIR/StreamingT2V
試玩地址2:https://replicate.com/camenduru/streaming-t2v
Udio AI提供多功能音頻生成 還可以創作喜劇、演講、電臺廣播等

【AiBase提要:】
⭐ Udio不僅可以創作音樂,還可以創作喜劇、演講、NPC對話、體育分析、廣告、電臺廣播、ASMR、自然音效等。
⭐ 簡單的文字描述創作: 用戶可通過簡單文字描述指導Udio生成特定主題和情感的音樂作品。
⭐ 廣泛的音樂類型和風格支持: Udio支持多種音樂類型和風格,滿足不同用戶的音樂品味。
感興趣的可以點擊播放列表查看:https://www.udio.com/playlists/deGuVDLYd9MrXtxnxfX7z1
美圖Wink“AI動漫”功能升級 可將短劇作品轉化爲動漫風格

【AiBase提要:】
⭐ 近期美圖Wink升級“AI動漫”功能,轉化短劇作品爲動漫風格。
⭐ 引入CFA模塊,優化動作一致性,生成更流暢自然的動漫視頻。
⭐ 分片技術處理長視頻,減少等待時長,讓創作更自如流暢。
StableDesign:適用於室內裝修設計的SD方案 文字提示就可修改室內設計圖

【AiBase提要:】
⭐️ 開發者創建了用於生成式室內設計的項目
⭐️ 通過下載愛彼迎房源數據和圖像元數據,提取特徵,實現訓練
⭐️ 使用ControlNet和勞拉模型訓練,實現室內設計生成的控制和文本到圖像轉換
在線體驗:https://huggingface.co/spaces/MykolaL/StableDesign
比換臉更強大!SwapAnything:替換圖片中的任意元素

【AiBase提要:】
🔍 SwapAnything框架具有精確控制對象和部分、保留上下文像素、適應個性化概念等優勢。
🔍 通過定向變量交換和外觀調整技術,SwapAnything展現了精確和忠實的交換能力。
🔍 SwapAnything能在圖像中精確控制任意對象,實現高質量的個性化交換。
項目入口:https://top.aibase.com/tool/swapanything
AI延時視頻生成工具MagicTime在線體驗地址放出

【AiBase提要】
⭐ 時間延遲視頻是攝影技術,展示長時間變化。
⭐ MagicTime能根據文本描述生成時間延遲視頻。
⭐ 應用廣泛,可記錄自然現象和人爲變化。
項目地址:https://top.aibase.com/tool/magictime
體驗地址:https://huggingface.co/spaces/BestWishYsh/MagicTime
模型下載地址:https://huggingface.co/Kijai/MagicTime-merged-fp16
自動化寫作工具STORM:可生成像維基百科一樣的深度長篇內容

【AiBase提要:】
⭐️STORM自動蒐集資料,模擬專家對話,生成結構化文章大綱。
⭐️STORM高效研究、整合多角度信息,促進深入理解和精準問題生成。
⭐️STORM生成文章大綱後,完整撰寫、潤色文章以提高整體質量。
Meta 推出 ViewDiff 模型:文本生成多視角3D 圖像
【AiBase提要:】
🌟 ViewDiff 解決了文本生成一致性、多視角3D 圖像的三大難點
🌟 自迴歸生成模塊使 ViewDiff 在任意視角上生成更多的3D 一致性圖像
🌟 ViewDiff 填補了文本生成多視角3D 圖像領域的技術空白
論文地址:https://arxiv.org/abs/2403.01807
📰🤖📢AI新鮮事
首個AI程序員造假被抓,Devin再次“震撼”硅谷!扒皮視頻文字詳解附上

【AiBase提要:】
⭐️ 油管程序員揭露首個AI程序員Devin視頻造假
⭐️ Devin演示不如實際神奇,修復bug自創bug
⭐️ 遭到疑問和打假,網友對AI產品炒作嗤之以鼻
詳細內容:https://www.chinaz.com/2024/0415/1610127.shtml
馬斯克XAI發佈Grok-1.5Vision多模態模型,可處理文本和圖片信息

【AiBase提要:】
⭐️ Grok-1.5Vision模型展現卓越性能,超越GPT4V。
⭐️ 在RealWorldQA基準測試中表現優異,理解真實世界物理空間。
⭐️ Grok-1.5Vision模型具有強大的現實世界空間處理和理解能力。
官網地址:https://top.aibase.com/tool/grok-1-5-vision-preview
360智腦7B參數大模型正式開源 最長支持約50萬字輸入
【AiBase提要:】
🧠360智腦7B參數大模型正式開源。
🧩 支持不同文本長度版本,最長可處理360K長文本。
🔥 在能力測試中表現出色,綜合能力排名前三。
項目地址:https://github.com/Qihoo360/360zhinao
Adobe圖像生成AI “Firefly” 訓練集中約有5%爲AI圖像
【AiBase提要:】
⭐ Adobe Stock開始接受AI內容,約14%爲AI生成圖像。
⭐ 學者指出Firefly學習自Midjourney生成的圖像,與其聲稱不同。
⭐ 用戶表示對Adobe用其作品訓練Firefly感到不滿。
代碼、模型全開源!賈佳亞團隊多模態模型 Mini-Gemini登上熱榜

【AiBase提要:】
⭐️ Mini-Gemini模型在多模態任務上取得顯著成績,開源代碼和模型數據。
⭐️ Mini-Gemini結合圖像理解和生成,展現出色圖像推理能力。
⭐️ 採用Gemini視覺雙分支信息挖掘方法,有效處理高分辨率圖像並生成內容豐富的視覺和文本內容。
項目地址:https://top.aibase.com/tool/mini-gemini
試玩地址: https://103.170.5.190:7860/
面壁智能開源MiniCPM2.0系列模型 OCR等能力顯著增強
【AiBase提要:】
⭐ MiniCPM-V2.0是端側最強的多模態模型,具有強大的OCR能力。
⭐ MiniCPM-1.2B是適配端側場景的基座模型,推理速度快成本低。
⭐ MiniCPM-2B-128K是目前最小的長文本模型,處理128K文本內容。
MiniCPM-V2.0:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM系列開源地址:
https://github.com/OpenBMB/MiniCPM
MiniCPM技術Blog地址:
https://openbmb.vercel.app/?category=Chinese+Blog
競爭升溫!ChatGPT增長疲軟3月全球訪問量17.7億次,Claude逐漸崛起
【AiBase提要:】
📉 ChatGPT全球訪問量增長放緩,儘管推出新功能。
🚀 Anthropic的Claude在歐洲市場蓬勃發展,加劇與ChatGPT的競爭。
💥 Claude3發佈後持續快速增長,顯示新產品潛力。
InstantID團隊推新風格遷移方法InstantStyle 一鍵置身“梵高星空”

【AiBase提要:】
⭐️特徵相減:利用CLIP模型的特性,通過特徵相減去除內容信息,實現風格和內容解耦。
⭐️僅風格層注入:在特定風格層完成特徵注入,實現風格和內容解耦。
⭐️通用性強:InstantStyle的方法具有通用性,提供豐富代碼實現,支持多種應用場景。
項目地址:https://top.aibase.com/tool/instantstyle
在線試玩:https://huggingface.co/spaces/InstantX/InstantStyle
——————
每日midjourney prompt:小說古風美女

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
A beautiful woman from ancient China, dressed in a gorgeous red Hanfu, with long hair draped over her shoulders, sat in her boudoir with a smile. Ancient style, hanfu, boudoir, gorgeous, palace, screen, carpet, soft light, elegant temperament, ancient culture, in line with oriental aesthetics, rich details, best quality, exquisite makeup, clear eyeliner pen, slender eyebrows, textured skin, white skin, charming headdress, --ar3:4 --niji6 --style raw
一箇中國古代美女,穿着華麗的紅色漢服,長髮披肩,微笑着坐在閨房內。古風,漢服,閨房,華麗,宮殿,屏風,地毯,柔和光線,高雅氣質,古代文化,符合東方美學,細節豐富,品質最佳,精緻的妝容,清晰的眼線筆,纖細的眉毛,紋理皮膚,白皙的皮膚,迷人的頭飾
