AI日報：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上線測試；百度網盤推寶寶AI長相預測；Luma AI推首尾幀視頻生成

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、炸裂！Runway Gen 3可以生成電影片頭3D巨幅字幕效果了

Runway最新推出的Gen-3Alpha視頻生成模型在保真度、一致性和動作表現方面有重大改進，不僅生成穩定光影，還展現強大想象力。內測博主展示了3D巨幅字幕效果，Gen3即將對所有人開放使用。模型精細控制運動，審美強大，想象力豐富，符合物理規律，生成速度快。

【AiBase提要:】
⚙️ Runway Gen3 可模仿漫威電影片頭效果製作3D巨幅字幕效果
💡 極度穩定的光影效果，保持高質量輸出，即使在高速移動場景中
🎥 控制模式包括 Motion Brush、高級攝像頭控制、導演模式，生成速度快，審美強大
詳情鏈接:https://top.aibase.com/tool/gen-3-alpha

2、百度網盤一刻相冊App推出寶寶AI長相預測功能

百度網盤一刻相冊App推出了AI長相預測功能，用戶上傳照片即可預測寶寶未來樣子，訓練數據貼閤中國寶寶特徵，操作簡單快速。未來將開發更多實用AI功能，徵集用戶意見。

【AiBase提要:】
👶 預測寶寶未來樣子，訓練數據貼閤中國寶寶特徵，操作簡單快速。
📸 上傳照片即可得到高清預測圖像，提供多種時尚濾鏡效果供選擇。
🔮 未來將開發更多實用AI功能，如預測孩子不同成長階段的樣子，徵集用戶意見。

3、谷歌推出AI視頻編輯應用Google Vids 上線測試

谷歌最新推出的AI視頻編輯應用Google Vids在測試中展現出強大的功能和用戶友好的特點，爲用戶提供了高效、便捷的視頻編輯工具。該應用集成Gemini大模型，幫助用戶輕鬆創建視頻內容，降低了視頻製作門檻，未來有望成爲視頻創作者的得力助手。

【AiBase提要:】
✨ Google Vids集成Gemini大模型，可幫助用戶創建幻燈片、編寫視頻腳本，並製作分鏡頭腳本。
🎥 用戶通過添加或刪除元素來編輯視頻，最終導出爲MP4文件，入口位於Google Docs文檔處理工具中。
🚀 Google Vids的上線測試豐富了Google Workspace套件，展示強大的AI技術能力，爲用戶提供便捷的視頻編輯工具。

4、Luma AI新功能：首尾幀生成視頻與向後延長5秒

Luma AI推出了新功能，讓視頻創作充滿無限可能，雖然偶爾會有硬切換畫面，但這正是剪輯的魅力所在，讓每一秒充滿驚喜和創意。未來的視頻生成將基於這種延長操作完成，實現智能個性化的視頻創作。

【AiBase提要:】
✨ 視頻延長魔法：首尾幀生成視頻能力，向後延長5秒，讓每一幀充滿無限可能
💡 創新視頻功能“Extend”：智能分析視頻內容，保持原有風格和對象一致性的基礎上延長視頻長度
🌟 Dream Machine模型發佈：支持文本和圖片輸入，生成高質量視頻，模擬現實物理特性，免費開放體驗
詳情鏈接:https://top.aibase.com/tool/dream-machine

5、全新Solos AirGo Vision智能眼鏡發佈

Solos公司在香港智能眼鏡峯會上發佈了全新的Solos AirGo Vision智能眼鏡，集成了ChatGPT-4o的可穿戴AI大腦，讓用戶的雙眼瞬間升級爲超能力。這款智能眼鏡不僅支持實時問答和視覺提示，還具備多語言翻譯功能，模塊化設計，售價爲249美元。

【AiBase提要:】
⭐ 集成 ChatGPT-4o 的多模態 AI 功能，支持實時問答和視覺提示
⭐ 支持超過10種語言的實時翻譯，輕鬆打破語言障礙
⭐ 模塊化設計，可替換不同樣式的傳統框架，售價爲249美元

6、商湯如影AI視頻生成平臺推出央視記者王冰冰AI數字人

商湯科技的AI數字人“AI冰冰”在《2024中國・AI 盛典》中首次亮相，展現了出色的多語言能力和逼真的視覺效果。數字人技術在傳媒行業具有巨大潛力，能夠拉近人物IP與受衆之間的距離。

【AiBase提要:】
✨ 商湯科技創造的AI數字人“AI冰冰”在舞臺上展現出專業且自然的表現，得益於SenseNova大模型技術。
🌐 如影平臺的AI視頻生成技術實現了高清複製和自然的表情、嘴型、動作效果，展示出卓越的語言能力。
🔥 商湯如影提供強大的核心技術支持，使AI冰冰能夠展現逼真的視覺效果和流暢的多語種表達能力。

7、知乎宣佈推出獨立AI搜索平臺「知乎直答」

知乎最近推出了全新AI產品「知乎直答」，旨在提升問答效率和質量，縮短用戶與優質回答之間的距離，增強社區創作者內容的流通。這一舉措預示着問答社區將進入更智能和個性化的新時代。

QQ截圖20240701090057.png

【AiBase提要:】
🚀 知乎直答是基於知乎豐富問答數據開發的AI產品，提供簡略和深入兩種答案生成方式，支持用戶快速找到所需內容或專家。
💡 產品定位爲生產力工具和發現世界的連接器，幫助用戶通過提問來探索世界的能力。
🔮 未來計劃推出App版本，引入多模態能力，與知乎社區深度融合，探索對外合作，爲整個問答領域帶來新的發展方向。
詳情鏈接:https://zhida.zhihu.com/

8、WhatsApp最新Android測試版2.24.14.7推出選擇Meta AI Llama模型功能

WhatsApp最新測試版引入了選擇Meta AI Llama模型的功能，用戶可以根據需求自定義AI交互體驗，體驗更快速簡單的迴應或處理更復雜的查詢。該功能展示了WhatsApp在AI領域持續創新的決心。

【AiBase提要:】
🔍 WhatsApp最新Android測試版2.24.14.7通過Google Play Beta計劃推出選擇Meta AI Llama模型功能。
🧠 用戶可以選擇默認的Llama3-70B模型獲得更快速簡單的迴應，或選擇高級的Llama3-405B模型處理更復雜的查詢。
📈 WhatsApp計劃提供更先進的Llama3-405B模型預覽版，每週有使用次數限制，達到限制後用戶將回到默認模型繼續對話。

9、蘋果可能在今年秋季宣佈與谷歌 Gemini 的交易

蘋果計劃在今年秋季推出與谷歌 Gemini 的整合交易以及測試版的 Apple Intelligence，將人工智能作爲直接盈利途徑。第三方AI服務可能成爲蘋果的過渡選擇，同時蘋果將逐步推出自己的生成式AI系統。

【AiBase提要:】
🍎 蘋果計劃整合谷歌 Gemini 到設備中，推出測試版的 Apple Intelligence。
💡 蘋果將人工智能作爲直接盈利途徑，不僅僅是推動硬件銷售的功能。
🤖 第三方AI服務可能成爲蘋果的過渡選擇，同時蘋果將逐步推出自己的生成式AI系統。

10、GPTPdf：使用類似GPT-4o的多模態LLM分析PDF文件

近日，一款名爲gptpdf的開源項目在github贊火，使用了類似 GPT-4o 的 VLLM 模型解析 PDF 文件並轉換爲 Markdown 格式。該項目代碼簡潔高效，只有293行，卻能完美解析排版、數學公式、表格、圖片、圖表等各種內容。費用每頁平均成本爲0.013美元。

【AiBase提要:】
🔍 使用類似 GPT-4o 多模態模型解析 PDF 文件，轉換爲 Markdown 格式。
💻 代碼簡潔高效，僅293行。
🌟 解析結果幾乎完美包括排版、數學公式、表格、圖片、圖表等內容。
詳情鏈接:https://top.aibase.com/tool/gptpdf

11、AI音頻魔法師Resona V2A 可自動爲視頻配音效

在AI技術大行其道的時代，Resona V2A技術橫空出世，像一位神奇的魔術師，讓視頻自動開口，唱出屬於自己的旋律。這不僅是技術突破，更是創意者的福音。Resona V2A一鍵生成音頻，快速高效，創意者得力助手。高性價比，成本降低99%，提供高質量音頻解決方案。

【AiBase提要:】
🔮 視頻自動開口，唱出屬於自己的旋律，技術突破與創意者福音。
⚙️ 一鍵生成音頻，快速高效，加快音頻生成速度，創意者投入更多時間和精力到視頻創意設計。
💰 成本降低99%，高性價比的音頻解決方案，滿足不同用戶需求。
詳情鏈接:https://top.aibase.com/tool/resona-v2a

12、AI換裝黑科技 MMTryon虛擬試穿框架可按需搭配一鍵疊穿

中山大學和字節智創數字人團隊聯合推出的MMTryon虛擬試穿框架顛覆了傳統換裝方式，實現一鍵生成模特試穿效果，質量高且操作簡便。其服裝編碼器和多模態多參考注意機制讓換裝更精確靈活，打破了傳統算法束縛，獲得新SOTA。MMTryon不僅可試穿單件服裝，還支持組合換裝，無需分割，通過文本指令即可實現高質量虛擬換裝。

【AiBase提要:】
👗 一鍵生成模特試穿效果，質量高且操作簡便
🔥 打破傳統算法束縛，獲得新SOTA，支持組合換裝
💡 利用服裝編碼器和多模態多參考注意機制，換裝更精確靈活
詳情鏈接:https://arxiv.org/abs/2405.00448

AI日報：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上線測試；百度網盤推寶寶AI長相預測；Luma AI推首尾幀視頻生成

相關推薦

Runway發佈通用世界模型GWM-1，用像素預測構建可推理的虛擬世界

Runway 發佈全新 Gen-4.5視頻生成模型，提升創作與視覺質量

120 人團隊把萬億巨頭拉下馬：Runway Gen-4.5 盲測奪冠，正式宣戰谷歌與 OpenAI

AI視頻落地垂直領域!Runway開放模型微調權限，聚焦機器人與建築業

Luma與Runway瞄準機器人與自動駕駛，拓展未來營收版圖