歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、OpenAI宣佈ChatGPT搜索升級 支持地圖、高級語音等功能
OpenAI在最新的直播中宣佈了ChatGPT平臺的重大技術更新,推出了實時搜索和高級語音交互模式,極大提升了用戶體驗。通過優化搜索算法,用戶能夠快速獲取實時信息,並直接查看源鏈接,增強了信息的便捷性。此外,新增的視頻播放和地圖集成功能,爲用戶提供了更直觀的搜索體驗,提升了移動端的搜索效率。
【AiBase提要:】
📈 更新後的ChatGPT引入了實時搜索功能,優化了搜索算法,使用戶能夠快速獲取股票和新聞等實時信息。
🗣️ 新增的高級語音交互模式允許用戶通過語音進行多輪搜索,提供個性化的語音助手體驗。
🗺️ ChatGPT現在支持地圖集成功能,用戶可以直接查看地理位置信息,進行路線規劃和地點探索。
2、谷歌升級AI視頻生成模型 Veo2,4K分辨率、人類偏好評分優於Sora
谷歌最近發佈了其新一代視頻生成模型Veo2,旨在與OpenAI的Sora競爭。Veo2在視頻生成方面展現了更高的真實感和細膩度,用戶可以通過Google Labs的VideoFX平臺申請使用。此外,谷歌還更新了圖像生成模型Imagen3,進一步提升了生成圖像的真實感和色彩表現。
【AiBase提要:】
🎥 Veo2視頻生成模型質量優於OpenAI的Sora,用戶可申請使用。
🚀 用戶可以選擇視頻風格和效果,生成最高可達4K分辨率的視頻。
🎨 更新的Imagen3圖像生成模型表現出更好的藝術風格和用戶體驗。
詳情鏈接:https://labs.google/fx/tools/video-fx
3、Midjourney推出個性化模型與情緒板,可上傳圖像訓練模型了
2024年12月16日,Midjourney公司推出了備受期待的“情緒版板”功能,允許用戶上傳靈感圖像集以生成新藝術作品。配合最新的AI模型,用戶可以更輕鬆地創建個性化資料,簡化了模型建立過程,降低了新用戶的入門門檻。此外,增強的組織功能使得用戶能夠更好地管理多個項目。
【AiBase提要:】
🌟 Midjourney推出心情板功能,用戶可上傳靈感圖像集。
🚀 個性化資料的創建變得更簡單,用戶只需40個評分即可開始。
🛠️ 組織功能增強,用戶可命名資料並追蹤相關圖像。
詳情鏈接:https://www.midjourney.com/personalize
4、谷歌推出全新AI工具Whisk無需提示詞,可多張圖片混合生成新風格圖像
谷歌最新推出的AI工具Whisk,顯著改變了傳統的圖像生成方式,允許用戶通過上傳多張圖片來生成新圖像,而不再依賴於冗長的文字描述。Whisk的設計旨在快速進行視覺探索,用戶可以輕鬆地將不同風格和主題的圖像融合,創造出獨特的視覺作品。儘管生成圖像的過程可能需要幾秒鐘,並且有時結果會略顯奇怪,但整體體驗非常有趣。
【AiBase提要:】
🎨 Whisk允許用戶通過多張圖片生成新風格圖像,顛覆了傳統的文字提示方式。
✨ 用戶可以上傳不同主題的圖片,自動融合生成有趣的視覺效果。
🚀 谷歌還發布了Imagen3和Veo2模型,進一步提升了圖像和視頻生成的能力。
詳情鏈接:https://top.aibase.com/tool/whisk
5、YouTube新功能上線:允許創作者授權第三方使用視頻訓練AI
YouTube最近推出了一項新功能,允許創作者選擇是否授權第三方公司使用他們的視頻進行人工智能模型的訓練。這一功能的默認設置爲關閉,創作者如果不希望第三方使用他們的視頻,無需採取任何行動。
【AiBase提要:】
🔒 默認設置爲關閉,創作者需主動選擇允許第三方使用其視頻進行AI訓練。
🤝 允許的第三方公司包括知名AI企業,如OpenAI、蘋果和微軟等。
📈 此功能旨在幫助創作者在AI時代實現內容的新價值。
6、圖森未來發布圖生視頻模型“Ruyi” 並開源Ruyi-Mini-7B
北京圖森未來科技有限公司於2024年12月17日發佈了其首款“圖生視頻”大模型“Ruyi”,並開源了Ruyi-Mini-7B版本,供用戶在huggingface平臺下載使用。該模型專爲消費級顯卡設計,具備多種生成能力,尤其在動漫和遊戲領域展現出色的視覺敘事潛力。儘管技術上取得進展,但仍需解決一些缺陷。
【AiBase提要:】
🚀 Ruyi大模型專爲消費級顯卡設計,支持多分辨率和多時長的視頻生成,能夠處理384×384到1024×1024的分辨率。
🎨 模型在幀間一致性、動作流暢性和色彩呈現方面表現卓越,成爲ACG愛好者的理想創意夥伴。
🔧 儘管技術上取得進展,Ruyi仍存在一些缺陷,如手部畸形和麪部細節崩壞,圖森未來正在努力改進。
詳情鏈接:https://huggingface.co/IamCreateAI/Ruyi-Mini-7B
7、智譜AI完成30億元融資 推動大模型技術研發與商業化
智譜公司近期成功完成30億元人民幣的新一輪融資,吸引了衆多戰略投資者和國資機構的參與。這筆資金將用於智譜基座大模型的研發升級,進一步提升其在複雜推理和多模態任務解決方面的能力。儘管面臨市場競爭和技術進展放緩的挑戰,智譜依然在AI行業中保持領先地位,並在全球範圍內產生顯著影響。【AiBase提要:】
🚀 智譜公司完成30億元融資,資金將用於基座大模型的研發和升級,推動行業創新。
📈 今年智譜在B端市場實現逆勢增長,API收入同比增長超過30倍,付費客戶數增長20倍。
🌍 智譜的C端產品“智譜清言”吸引超過2500萬用戶,預計付費功能將帶來千萬級收入。
8、Meta 推出開源AI試衣模型 Leffa:保留更多細節
Meta最近推出了Leffa,一個開源的AI虛擬試穿框架,旨在通過生成新圖像提升用戶的穿衣體驗。用戶只需上傳一張參考圖片,系統便能生成新的穿搭效果,減少了因不合適而退換貨的麻煩。Leffa在保留細節和減少圖像失真方面表現出色,提供了更自然的試穿效果。
【AiBase提要:】
🌟 Leffa 是 Meta 推出的開源虛擬試穿框架,可以根據參考圖像生成新圖像。
👗 該框架能有效減少圖像失真,保留更多細節,提高虛擬試穿體驗。
💻 用戶可在 Hugging Face 平臺上試用 Leffa,同時 Meta 提供了完整的項目代碼。
詳情鏈接:https://github.com/franciszzj/Leffa
9、Diffusion-Vas:追蹤視頻目標,可補全遮擋部分
在視頻分析領域,物體的持久性是理解物體存在的重要線索。研究者提出的Diffusion-Vas方法,基於擴散先驗,旨在提升視頻無模態分割和內容補全的效果。該方法分爲兩個階段,首先生成無模態掩碼,然後利用條件生成模型對遮擋區域進行內容補全。經過多項基準測試,該方法在複雜場景下表現優異,準確率提高了13%。
【AiBase提要:】
🌟 研究提出了一種新方法,通過擴散先驗實現視頻中的無模態分割和內容補全。
🖼️ 方法分爲兩階段,首先生成無模態掩碼,然後進行遮擋區域的內容補全。
📊 在多項基準測試中,該方法顯著提高了無模態分割的準確性,尤其在複雜場景下表現優異。
詳情鏈接:https://diffusion-vas.github.io/
10、Meta智能眼鏡Ray-Ban Meta升級:實時AI視頻與翻譯功能
Meta公司對Ray-Ban Meta智能眼鏡進行了重要更新,推出了多項基於人工智能的新功能,包括實時對話和語言翻譯。這些功能使用戶能夠與AI助手進行更自然的交流,無需頻繁喚醒助手,同時也支持多語言即時翻譯,極大提升了用戶的溝通便利性。此外,眼鏡還新增了Shazam功能,用戶可以通過語音識別音樂。
【AiBase提要:】
🌟 Ray-Ban Meta智能眼鏡推出實時AI視頻和翻譯功能,用戶可隨時與AI助手對話。
🌍 新增的實時翻譯功能支持多種語言之間的即時翻譯,提升了用戶交流的便利性。
🎵 眼鏡還支持Shazam功能,用戶可通過語音識別當前播放的音樂。
11、博通CEO預測AI市場大爆發 公司市值突破1萬億美元
博通公司首席執行官Hock Tan在最近的財報電話會議上對AI芯片市場表達了樂觀的展望,預計到2027年,博通在這一領域的收入將顯著增長,服務可尋址市場預計在600億至900億美元之間。公司市值因AI芯片需求激增首次突破1萬億美元。
【AiBase提要:】
🌟 博通預計到2027年AI市場服務可尋址市場將達到600億至900億美元。
📈 博通市值因AI芯片需求激增首次突破1萬億美元。
💰 通過收購VMware,博通整體收入增長達51%,且運營成本大幅降低。
12、金山辦公:WPS AI將免費解鎖AI生成PPT等四大功能
金山辦公宣佈WPS AI將在年終期間爲用戶提供四項免費功能,旨在提升工作效率和創意。用戶可以使用AI生成PPT、風格克隆、濾鏡等功能,快速製作專業的年終總結PPT。此外,WPS還提供多樣化的PPT模板,滿足不同用戶需求。
【AiBase提要:】
🎉 WPS AI將免費解鎖AI生成PPT、風格克隆、濾鏡和模板功能,提升用戶工作效率。
🖼️ AI生成PPT功能可快速生成專業PPT,智能潤色內容,保持邏輯和設計美感。
📋 用戶可通過“AI總結季”參與活動,獲取豐富的年終總結PPT模板,滿足不同行業需求。