歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、阿里開源在手機上運行的3D數字人應用:MNN TaoAvatar,可做虛擬客服、虛擬主播

阿里巴巴集團通過開源MNN TaoAvatar,將高保真的3D虛擬形象生成與實時交互能力引入移動設備,爲直播、虛擬社交和AR應用帶來全新可能性。

【AiBase提要:】

✨ MNN TaoAvatar支持真3D虛擬角色實時生成與驅動,能在手機上以90FPS流暢運行。

🌟 結合3D高斯濺射技術,實現毫米級精細控制,確保虛擬角色動作自然同步。

🌐 開源生態提供豐富API和工具,支持多模態輸入,降低開發門檻,加速技術普及。

詳情鏈接:https://github.com/alibaba/MNN

2、MiniMax Agent上線!圖像生成+多語言支持 長任務處理更智能

MiniMax官方宣佈其AI生產力工具MiniMax Agent迎來重大升級,新增智能圖像搜索、穩定的圖像生成、多語言支持及多樣化文檔導出功能,全面提升用戶體驗。

image.png

【AiBase提要:】

🌟新增智能圖像搜索與生成功能,支持複雜場景和創意表達,適用於設計、營銷和內容創作。

📚引入反思模式,增強長任務處理能力,特別適合需要深度推理的場景,如學術研究或代碼調試。

🌍新增中文、日文、韓文支持,優化Python繪圖功能,填補亞洲語言支持空白,提升本地化體驗。

詳情鏈接:https://agent.minimax.io

3、羅永浩數字人直播即將首秀百度電商,再探“AI+IP”帶貨新模式

知名電商主播羅永浩宣佈其數字人形象將在百度電商平臺開啓直播帶貨,這是他首次嘗試數字人直播,背後依託百度的技術支持,展現了‘AI+頭部IP’模式的巨大潛力。

QQ20250613-102955.png

【AiBase提要:】

羅永浩數字人直播將於6月15日在百度電商開啓,標誌着頭部主播與數字人技術的首次結合。

百度電商平臺已有超10萬數字人主播,數字人直播可使商家運營成本下降超80%,GMV平均提升62%。

此次嘗試可能推動直播電商行業向智能化、高效率、低成本方向發展。

4、OpenAI員工套現潮達30億美元,軟銀成最大‘接盤俠’

本文探討了OpenAI員工通過多次股權出售累計套現近30億美元的現象,分析了背後的原因及影響,並揭示了軟銀作爲最大買家的角色。

【AiBase提要:】

自2021年以來,OpenAI員工通過多次股權出售累計套現近30億美元,軟銀成爲最大買家。

員工股權變現頻率高,參與熱情不減,但可能加速離職。

激烈的AI人才競爭中,OpenAI面臨巨大壓力,如何留住核心團隊是關鍵挑戰。

5、OpenAI重磅升級ChatGPT Projects:深度研究+語音模式

這次ChatGPT Projects的功能更新讓人感到非常興奮。深度研究和語音模式的加入讓AI助手變得更加智能和易用,特別是在跨平臺協作和移動辦公方面有了顯著提升。它讓用戶在處理複雜任務時更加得心應手。

image.png

【AiBase提要:】

深度研究支持:結合內外部數據,提供精準信息檢索,適合複雜場景。

語音模式集成:通過語音交互提升移動辦公便捷性,滿足實時協作需求。

移動端增強:支持多模態交互,包括文件上傳和實時共享,擴展使用場景。

詳情鏈接:https://help.openai.com/en/articles/10169521-using-projects-in-chatgpt

6、Meta 新型模型助力機器人在未知環境中實現物體操控

Meta 推出的 V-JEPA2模型通過視頻和物理交互構建世界模型,使機器人能在動態環境中進行預測和規劃,尤其適用於物流和製造業。

image.png

【AiBase提要:】

🔍 V-JEPA2模型通過觀察視頻和物理交互構建世界模型,提升機器人在動態環境中的操作能力。

🤖 支持零-shot 機器人規劃,機器人可操控陌生物體,無需額外訓練。

📈 廣泛應用於物流和製造業,提高機器人適應性並減少重編程需求。

詳情鏈接:https://ai.meta.com/vjepa/

7、AMD 與 OpenAI 聯合發佈強大 AI 芯片:推理性能提升35倍

AMD 與 OpenAI 推出了最新的 Instinct MI400和 MI350系列 AI 芯片,MI350系列顯著提升了 AI 計算性能,MI400系列則面向下一代旗艦 AI 計算需求。此外,ROCm7平臺進一步推動了 AI 開發者的效率。

image.png

【AiBase提要:】

🚀 MI350系列 GPU 提供卓越的 AI 計算性能,內存帶寬高達8TB/s,推理性能提升35倍。

🌟 MI400系列專爲低精度計算優化,FP4性能可達40petaflops,UALink 技術實現 GPU 無縫互聯。

🌐 ROCm7平臺整合多個頂級 AI 平臺,提供超過3.5倍推理性能提升,助力開發者高效工作。

8、Imagen4登陸Gemini!聊天秒變畫廊,AI圖像生成進入新紀元

Google旗下的Gemini平臺通過集成最新一代的Imagen4圖像生成模型,實現了從複雜細節到文本渲染的全面升級,同時支持聊天中直接生成和調整圖像,爲創意設計、營銷及教育等領域提供強大支持。

QQ20250613-103026.jpg

【AiBase提要:】

✨ 細節呈現卓越:複雜織物、動物毛髮等細節清晰逼真,媲美專業攝影。

💬 交互體驗升級:聊天生成圖像,支持實時調整,創作效率大幅提升。

🌟 應用場景廣泛:適用於設計、營銷、教育等,支持2K分辨率,滿足多領域需求。

9、谷歌 AI 助力氣候預測:打破傳統模型的侷限,精確到10公里!

本文介紹了谷歌研究人員結合物理建模與生成AI的新方法,通過動態生成下采樣法和R2D2模型,將全球氣候預測提升至約10公里的分辨率,大幅降低計算成本並提高預測準確性。

image.png

【AiBase提要:】

🌍 利用AI技術將全球氣候預測轉化爲10公里分辨率的地方預測,縮小模型與實際需求間的差距。

⚡️ R2D2模型結合物理與AI優勢,提升預測準確性且能高效推廣至未見過的情景。

💰 新方法顯著降低計算成本,僅爲傳統高分辨率模擬所需的一小部分,適用於更多領域。

詳情鏈接:https://research.google/blog/zooming-in-efficient-regional-environmental-risk-assessment-with-generative-ai/

10、加速發展:Gartner 預測生成 AI 應用將實現50% 的交付時間縮減

Gartner 預測到2028年,80% 的生成 AI 商業應用將在現有數據管理平臺上開發,這將使交付時間縮短50%。RAG 技術的應用能夠顯著提升生成 AI 模型的準確性和可靠性,同時簡化數據治理過程。

【AiBase提要:】

🌟預計到2028年,80% 的生成 AI 商業應用將在現有數據管理平臺上開發,交付時間縮短50%。

🚀檢索增強生成(RAG)將成爲開發生成 AI 應用的重要基礎,提供靈活性和可解釋性。

🔍Gartner 建議企業評估現有平臺的轉型潛力,整合 RAG 技術並利用元數據保護安全。