歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://top.aibase.com/

1、炸裂!Runway Gen 3可以生成電影片頭3D巨幅字幕效果了

Runway最新推出的Gen-3Alpha視頻生成模型在保真度、一致性和動作表現方面有重大改進,不僅生成穩定光影,還展現強大想象力。內測博主展示了3D巨幅字幕效果,Gen3即將對所有人開放使用。模型精細控制運動,審美強大,想象力豐富,符合物理規律,生成速度快。

【AiBase提要:】

⚙️ Runway Gen3 可模仿漫威電影片頭效果製作3D巨幅字幕效果

💡 極度穩定的光影效果,保持高質量輸出,即使在高速移動場景中

🎥 控制模式包括 Motion Brush、高級攝像頭控制、導演模式,生成速度快,審美強大

詳情鏈接:https://top.aibase.com/tool/gen-3-alpha

2、百度網盤一刻相冊App推出寶寶AI長相預測功能

百度網盤一刻相冊App推出了AI長相預測功能,用戶上傳照片即可預測寶寶未來樣子,訓練數據貼閤中國寶寶特徵,操作簡單快速。未來將開發更多實用AI功能,徵集用戶意見。


image.png

【AiBase提要:】

👶 預測寶寶未來樣子,訓練數據貼閤中國寶寶特徵,操作簡單快速。

📸 上傳照片即可得到高清預測圖像,提供多種時尚濾鏡效果供選擇。

🔮 未來將開發更多實用AI功能,如預測孩子不同成長階段的樣子,徵集用戶意見。

3、谷歌推出AI視頻編輯應用Google Vids 上線測試

谷歌最新推出的AI視頻編輯應用Google Vids在測試中展現出強大的功能和用戶友好的特點,爲用戶提供了高效、便捷的視頻編輯工具。該應用集成Gemini大模型,幫助用戶輕鬆創建視頻內容,降低了視頻製作門檻,未來有望成爲視頻創作者的得力助手。

【AiBase提要:】

✨ Google Vids集成Gemini大模型,可幫助用戶創建幻燈片、編寫視頻腳本,並製作分鏡頭腳本。

🎥 用戶通過添加或刪除元素來編輯視頻,最終導出爲MP4文件,入口位於Google Docs文檔處理工具中。

🚀 Google Vids的上線測試豐富了Google Workspace套件,展示強大的AI技術能力,爲用戶提供便捷的視頻編輯工具。

4、Luma AI新功能:首尾幀生成視頻與向後延長5秒

Luma AI推出了新功能,讓視頻創作充滿無限可能,雖然偶爾會有硬切換畫面,但這正是剪輯的魅力所在,讓每一秒充滿驚喜和創意。未來的視頻生成將基於這種延長操作完成,實現智能個性化的視頻創作。

【AiBase提要:】

✨ 視頻延長魔法:首尾幀生成視頻能力,向後延長5秒,讓每一幀充滿無限可能

💡 創新視頻功能“Extend”:智能分析視頻內容,保持原有風格和對象一致性的基礎上延長視頻長度

🌟 Dream Machine模型發佈:支持文本和圖片輸入,生成高質量視頻,模擬現實物理特性,免費開放體驗

詳情鏈接:https://top.aibase.com/tool/dream-machine

5、全新Solos AirGo Vision智能眼鏡發佈

Solos公司在香港智能眼鏡峯會上發佈了全新的Solos AirGo Vision智能眼鏡,集成了ChatGPT-4o的可穿戴AI大腦,讓用戶的雙眼瞬間升級爲超能力。這款智能眼鏡不僅支持實時問答和視覺提示,還具備多語言翻譯功能,模塊化設計,售價爲249美元。

【AiBase提要:】

⭐ 集成 ChatGPT-4o 的多模態 AI 功能,支持實時問答和視覺提示

⭐ 支持超過10種語言的實時翻譯,輕鬆打破語言障礙

⭐ 模塊化設計,可替換不同樣式的傳統框架,售價爲249美元

6、商湯如影AI視頻生成平臺推出央視記者王冰冰AI數字人

商湯科技的AI數字人“AI冰冰”在《2024中國・AI 盛典》中首次亮相,展現了出色的多語言能力和逼真的視覺效果。數字人技術在傳媒行業具有巨大潛力,能夠拉近人物IP與受衆之間的距離。

【AiBase提要:】

✨ 商湯科技創造的AI數字人“AI冰冰”在舞臺上展現出專業且自然的表現,得益於SenseNova大模型技術。

🌐 如影平臺的AI視頻生成技術實現了高清複製和自然的表情、嘴型、動作效果,展示出卓越的語言能力。

🔥 商湯如影提供強大的核心技術支持,使AI冰冰能夠展現逼真的視覺效果和流暢的多語種表達能力。

7、知乎宣佈推出獨立AI搜索平臺「知乎直答」

知乎最近推出了全新AI產品「知乎直答」,旨在提升問答效率和質量,縮短用戶與優質回答之間的距離,增強社區創作者內容的流通。這一舉措預示着問答社區將進入更智能和個性化的新時代。

QQ截圖20240701090057.png

【AiBase提要:】

🚀 知乎直答是基於知乎豐富問答數據開發的AI產品,提供簡略和深入兩種答案生成方式,支持用戶快速找到所需內容或專家。

💡 產品定位爲生產力工具和發現世界的連接器,幫助用戶通過提問來探索世界的能力。

🔮 未來計劃推出App版本,引入多模態能力,與知乎社區深度融合,探索對外合作,爲整個問答領域帶來新的發展方向。

詳情鏈接:https://zhida.zhihu.com/

8、WhatsApp最新Android測試版2.24.14.7推出選擇Meta AI Llama模型功能

WhatsApp最新測試版引入了選擇Meta AI Llama模型的功能,用戶可以根據需求自定義AI交互體驗,體驗更快速簡單的迴應或處理更復雜的查詢。該功能展示了WhatsApp在AI領域持續創新的決心。

【AiBase提要:】

🔍 WhatsApp最新Android測試版2.24.14.7通過Google Play Beta計劃推出選擇Meta AI Llama模型功能。

🧠 用戶可以選擇默認的Llama3-70B模型獲得更快速簡單的迴應,或選擇高級的Llama3-405B模型處理更復雜的查詢。

📈 WhatsApp計劃提供更先進的Llama3-405B模型預覽版,每週有使用次數限制,達到限制後用戶將回到默認模型繼續對話。

9、蘋果可能在今年秋季宣佈與谷歌 Gemini 的交易

蘋果計劃在今年秋季推出與谷歌 Gemini 的整合交易以及測試版的 Apple Intelligence,將人工智能作爲直接盈利途徑。第三方AI服務可能成爲蘋果的過渡選擇,同時蘋果將逐步推出自己的生成式AI系統。

【AiBase提要:】

🍎 蘋果計劃整合谷歌 Gemini 到設備中,推出測試版的 Apple Intelligence。

💡 蘋果將人工智能作爲直接盈利途徑,不僅僅是推動硬件銷售的功能。

🤖 第三方AI服務可能成爲蘋果的過渡選擇,同時蘋果將逐步推出自己的生成式AI系統。

10、GPTPdf:使用類似GPT-4o的多模態LLM分析PDF文件

近日,一款名爲gptpdf的開源項目在github贊火,使用了類似 GPT-4o 的 VLLM 模型解析 PDF 文件並轉換爲 Markdown 格式。該項目代碼簡潔高效,只有293行,卻能完美解析排版、數學公式、表格、圖片、圖表等各種內容。費用每頁平均成本爲0.013美元。

image.png

【AiBase提要:】

🔍 使用類似 GPT-4o 多模態模型解析 PDF 文件,轉換爲 Markdown 格式。

💻 代碼簡潔高效,僅293行。

🌟 解析結果幾乎完美包括排版、數學公式、表格、圖片、圖表等內容。

詳情鏈接:https://top.aibase.com/tool/gptpdf

11、AI音頻魔法師Resona V2A 可自動爲視頻配音效

在AI技術大行其道的時代,Resona V2A技術橫空出世,像一位神奇的魔術師,讓視頻自動開口,唱出屬於自己的旋律。這不僅是技術突破,更是創意者的福音。Resona V2A一鍵生成音頻,快速高效,創意者得力助手。高性價比,成本降低99%,提供高質量音頻解決方案。

【AiBase提要:】

🔮 視頻自動開口,唱出屬於自己的旋律,技術突破與創意者福音。

⚙️ 一鍵生成音頻,快速高效,加快音頻生成速度,創意者投入更多時間和精力到視頻創意設計。

💰 成本降低99%,高性價比的音頻解決方案,滿足不同用戶需求。

詳情鏈接:https://top.aibase.com/tool/resona-v2a

12、AI換裝黑科技 MMTryon虛擬試穿框架可按需搭配一鍵疊穿

中山大學和字節智創數字人團隊聯合推出的MMTryon虛擬試穿框架顛覆了傳統換裝方式,實現一鍵生成模特試穿效果,質量高且操作簡便。其服裝編碼器和多模態多參考注意機制讓換裝更精確靈活,打破了傳統算法束縛,獲得新SOTA。MMTryon不僅可試穿單件服裝,還支持組合換裝,無需分割,通過文本指令即可實現高質量虛擬換裝。

image.png

【AiBase提要:】

👗 一鍵生成模特試穿效果,質量高且操作簡便

🔥 打破傳統算法束縛,獲得新SOTA,支持組合換裝

💡 利用服裝編碼器和多模態多參考注意機制,換裝更精確靈活

詳情鏈接:https://arxiv.org/abs/2405.00448