AI日報：豆包推出Ola Friend智能體耳機；vivo發佈全新藍心大模型矩陣；開源版NotebookLM來了

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、豆包推出Ola Friend智能體耳機:售價1199元

豆包推出Ola Friend智能體耳機，這款集成了人工智能技術的耳機旨在爲用戶提供一個隨時陪伴在耳邊的AI朋友。用戶可以享受聽音樂、學習英語、獲取導遊服務等多種功能，需要下載豆包APP來充分利用。

【AiBase提要:】
🎧 Ola Friend智能體耳機售價1199元，支持智能對話功能。
🤖 Ola Friend耳機是隨時陪伴在耳邊的AI朋友，提供聽音樂、學習英語、導遊服務等功能。
📱 用戶需下載豆包APP來充分利用Ola Friend耳機的功能，APP支持搜索信息、答疑解惑、激發靈感等多種功能。

2、vivo發佈全新藍心大模型矩陣

vivo在2024vivo開發者大會上發佈了全新藍心大模型矩陣，升級了語言、語音、圖像和多模態能力，提供更強大的性能和功能。新的藍心大模型矩陣將行業標準提升至新高度，爲用戶帶來更優質的體驗。

【AiBase提要:】
🚀 藍心大模型矩陣全面升級，包括語言、端側、語音、圖像和多模態大模型。
💡 推出30億藍心端側大模型3B，性能提升300%，功耗優化46%，內存減小63%，出詞速度達80字/s。
🔊 新自研藍心語音大模型支持自然語義理解、情感表達和同聲傳譯，圖像&多模態大模型強化中國特色與東方美學融合生成能力。

3、開源版NotebookLM來了!Podcastfy:輸入PDF、文本、網址等即可轉換成播客

在數字時代，製作引人入勝的多語言音頻內容成爲熱門話題。谷歌的NotebookLM備受好評，而開源Python軟件包Podcastfy引起廣泛關注。Podcastfy是開源版NotebookLM，採用先進的生成式人工智能技術，讓用戶實現更多個性化和規模化的播客製作。

【AiBase提要:】
🌟 Podcastfy是開源Python軟件包，可將文本和網絡內容轉換爲多語言音頻對話。
🎧 用戶可以通過Gradio演示應用或HuggingFace體驗Podcastfy，操作簡單易上手。
⚠️ 使用外部內容時，需確保擁有版權和權限，生成的音頻內容由AI生成，不模仿現實人物。
詳情鏈接:https://github.com/souzatharsis/podcastfy-demo?tab=readme-ov-file

4、圖像修復新魔法!突破性算法PMRF

PMRF（後驗均值修正流）算法是圖像處理領域的一項創新技術，解決了圖像恢復中失真與感知質量之間的矛盾，開闢了高質量圖像重建的新可能。其獨特之處在於在多種圖像恢復任務中展現卓越性能，取得了令人矚目的成績，平衡了失真和感知質量。

【AiBase提要:】
✨ PMRF算法巧妙結合後驗均值預測和修正流模型，創造全新圖像恢復框架，最大程度減少失真，提升感知質量。
🌟 應用廣泛，涵蓋去噪、超分辨率、修復受損區域和顏色恢復等多個方面，生成自然真實圖像。
💡 在基準和真實數據集測試中，PMRF表現優異，平衡失真和感知質量，樹立新的圖像恢復標準。
詳情鏈接:https://huggingface.co/spaces/ohayonguy/PMRF

5、沃爾瑪推出新型人工智能模型 Wallaby

沃爾瑪最近推出了名爲Wallaby的大型語言模型，專注於零售行業數據，旨在提升客戶服務體驗。他們採用多模型組合的方法，靈活應對不同應用需求。升級後的客戶支持助手能夠更精準地理解客戶意圖，提供個性化服務。

【AiBase提要:】
✨ 沃爾瑪推出 Wallaby 大型語言模型，專注於零售行業數據，旨在提升客戶服務體驗。
🤖 沃爾瑪採用多模型組合的方法，靈活應對不同應用需求。
🛍️ 升級後的客戶支持助手能夠更精準地理解客戶意圖，提供個性化服務。

6、誇張!GPT-4無意中掌握面部識別技術，準確率超越專業算法

最近的研究顯示，GPT-4具備了面部識別、性別判斷和年齡估算能力，準確率超越專業算法，但存在安全隱患。研究揭示了繞過GPT-4安全機制的方法，引發了對大型語言模型安全性的思考。儘管GPT-4在生物識別任務表現出色，研究作者警告不能完全依賴其識別能力。

【AiBase提要:】
🌟 GPT-4在性別識別測試中達到了100%的完美準確率，超越了DeepFace模型。
📊 GPT-4的年齡估算準確率爲74.25%，但對年長者的估算可能較寬泛。
🔒 研究發現可繞過GPT-4的安全機制，需加強對大型語言模型安全性的研究。

7、200萬用戶量!Hugging Face旗下Gradio5發佈:用自然語言輕鬆構建AI應用

Hugging Face旗下Gradio5發佈，致力於簡化AI開發，提供企業級安全性和AI Playground功能，進一步推動AI應用開發體驗。

【AiBase提要:】
🌟 Gradio5引入企業級安全性，確保應用安全無憂。
🚀 新增的AI Playground功能，簡化開發流程，讓生成應用變得輕鬆。
🔮 Hugging Face規劃未來，推出多種新功能，進一步提升AI應用開發體驗。
詳情鏈接:https://www.gradio.app/

8、OpenAI 申請法庭駁回馬斯克訴訟，稱其爲 “騷擾” 行爲

在這篇文章中，OpenAI向法庭申請駁回馬斯克對公司的訴訟，稱其爲“騷擾”行爲。文章揭示了馬斯克和OpenAI之間的法律糾紛背景，強調馬斯克的指控缺乏證據，並質疑他的法律地位。

【AiBase提要:】
🌟 馬斯克對 OpenAI 的多項訴訟被 OpenAI 稱爲 “騷擾”，並申請駁回。
📉 OpenAI 強調馬斯克的指控缺乏證據，稱其爲不切實際的主張。
⚖️ 馬斯克聲稱 OpenAI 未遵循創始協議的承諾，但法律上被質疑無權提出此類指控。

9、Zoom推數字分身功能:便利還是隱憂?

Zoom計劃推出數字分身功能引發了人們對於深度僞造技術的擔憂。雖然這項功能能提高視頻創作效率，但也可能帶來虛假信息傳播的風險。

【AiBase提要:】
✨ Zoom計劃推出數字分身功能，將用戶視頻轉化爲AI驅動的逼真數字化身，提高異步交流效率。
💡 深度僞造技術的普及使得區分真相和虛假信息變得困難，可能導致虛假視頻的濫用。
🔒 Zoom對安全措施描述模糊，仍需加強保護措施以防止惡意虛假視頻的生成。

10、DressRecon:輸入視頻就能構建出還原服裝細節的3D模型

近日，卡內基梅隆大學的研究團隊發佈了名爲“DressRecon”的新技術，通過單目視頻實現高質量的人體重建，尤其適用於寬鬆衣物和手持物體的場景。該技術利用神經隱式模型將身體與衣物變形分開處理，藉助圖像基礎的先驗知識捕捉細微幾何特徵。重建結果生成高保真的三維模型，支持從任意角度渲染，提升了可視化體驗。

【AiBase提要:】
👗 研究團隊推出DressRecon技術，通過單目視頻實現高質量的人體重建，特別適用於寬鬆衣物和手持物體的場景。
📷 該技術利用神經隱式模型將身體與衣物變形分開處理，藉助圖像基礎的先驗知識來捕捉細微幾何特徵。
🎥 重建結果不僅生成高保真的三維模型，還支持從任意角度渲染，提升了可視化體驗。
詳情鏈接:https://jefftan969.github.io/dressrecon/

11、DreamWaltz-G:從文本生成生動的3D 可動畫頭像

在數字化時代，個性化的虛擬形象受到關注。DreamWaltz-G框架通過結合骨骼引導的得分蒸餾和混合3D高斯表示，提升了頭像生成的一致性和動畫表現力。該框架支持形狀控制、視頻重演和多主體場景構建，拓展了數字內容創作的可能性。

【AiBase提要:】
📌 創新框架DreamWaltz-G能根據文本描述生成生動的3D可動畫頭像。
🎨 結合骨骼引導的得分蒸餾和混合3D高斯表示，提升頭像生成的一致性和動畫表現力。
🎥 支持形狀控制、視頻重演和多主體場景構建，拓展了數字內容創作的可能性。

AI日報：豆包推出Ola Friend智能體耳機；vivo發佈全新藍心大模型矩陣；開源版NotebookLM來了

相關推薦

字節豆包 AI 手機項目生變：硬件負責人離職，項目進入“調整期”

美團大模型生態調整：全面限用豆包，力推自研 LongCat 體系

豆包內測社交功能:打通飛書賬號，AI助手也要做熟人社交?

豆包付費時代開啓：三檔訂閱服務落地，性價比對標全球巨頭

豆包正式上線三檔付費訂閱服務:最高500元/月，整體接入2.1系列大模型