歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://top.aibase.com/

1、騰訊宣佈混元3D 2.1大模型對外開源

混元3D 2.1作爲首個全鏈路開源的工業級3D生成大模型,顯著提升了幾何生成質量和PBR材質生成能力,降低了開發門檻,適用於多個行業領域。

image.png

【AiBase提要:】

✨ 首個全鏈路開源工業級3D生成大模型,幾何生成與PBR材質生成效果顯著提升。

🎮 支持遊戲、電影、電商等領域生成高質量3D角色、道具與產品模型,告別傳統‘塑料感’。

💻 全鏈路開源且部署友好,適配消費級顯卡,適合個人與團隊快速上手開發。

詳情鏈接:https://3d-models.hunyuan.tencent.com/

2、OpenAI Codex 全新升級:讓程序員輕鬆獲取理想代碼

OpenAI Codex迎來重磅更新,通過生成多樣代碼版本提升開發效率,優化細節如加載進度查看、取消操作等,並支持複雜任務處理,助力開發者專注創新。

image.png

【AiBase提要:】

✨ Codex新增生成多種代碼版本功能,滿足不同需求,提升開發效率。

🔧 優化細節包括加載進度查看、取消操作及安裝問題修復,操作更靈活。

🌟 基於codex-1模型優化,提高代碼生成準確性,支持GitHub代碼庫提取。

3、字節跳動AI Lab負責人李航卸任,Seed團隊步入調整期

字節跳動AI Lab負責人李航卸任,轉爲勞務/顧問身份,標誌着字節跳動AI領域的核心團隊正在經歷重大調整。隨着吳永輝、朱文佳等人的加入及團隊重組,字節跳動在AI領域的戰略方向逐漸清晰。

image.png

【AiBase提要:】

李航卸任AI Lab負責人,轉爲勞務/顧問身份,標誌着字節跳動AI Lab的重大人事調整。

自2020年起,AI Lab逐步轉型爲技術中臺,並在2023-2024年將部分大模型團隊併入Seed團隊。

字節跳動AI Lab自2016年成立以來,歷經多位負責人領導,逐步成爲支撐字節跳動多項業務的技術核心。

4、微軟發佈 700 個真實 AI 案例,探索智能化工作新模式

微軟展示了700個AI應用案例,覆蓋多個行業,通過AI技術提高企業效率、優化工作體驗並提升客戶滿意度。

image.png

【AiBase提要:】

🌍 全球範圍內,微軟展示了700個AI應用案例,涵蓋金融、醫療、教育等多個行業。

🤖 AI智能體通過自動化任務,顯著減少工作時間,提升企業效率。

💼 衆多企業藉助AI提升客戶體驗,推動業務增長與運營優化。

5、微軟AI重磅發佈Code Researcher:58%崩潰解決率震撼業界!

我非常看好Code Researcher這款工具,它通過強大的語義分析和多步驟推理能力,顯著提高了系統級軟件維護的效率和準確性。作爲開發者,我期待它能進一步簡化我們的工作流程,減少手動調試的時間。

image.png

【AiBase提要:】

🔍 Code Researcher基於大型語言模型(LLM),能深度分析代碼庫和提交歷史,追蹤崩潰根本原因並生成修復補丁。

📈 在Linux內核崩潰修復測試中,Code Researcher的崩潰解決率高達58%,遠超SWE-agent的37.5%。

🌐 它適用於多種大型代碼庫,爲企業級軟件維護提供高效解決方案,推動系統級軟件開發自動化進程。

詳情鏈接:https://www.microsoft.com/en-us/research/publication/code-researcher-deep-research-agent-for-large-systems-code-and-commit-history/

6、AI監工上線!Observer AI讓屏幕自動化更高效,解放你的雙手

Observer AI作爲一款專爲屏幕自動化工具設計的AI框架,通過實時監控屏幕內容並進行智能化分析,顯著提升了操作效率,解決了傳統工具效率瓶頸的問題。

image.png

【AiBase提要:】

屏幕實時記錄:Observer AI通過高精度捕捉技術完整記錄界面變化,確保數據無遺漏。

AI智能分析:內置先進算法快速解析屏幕內容,識別任務完成情況或潛在問題。

自動化響應:支持調用MCP或自定義方案,自動執行下一步操作,實現閉環自動化。

詳情鏈接:https://github.com/Roy3838/Observer

7、Genspark AI 發佈革新性 AI Browser,開啓智能網絡瀏覽新時代

Genspark AI Browser是一款集成先進AI技術的新型瀏覽器,通過自動化與智能化功能提升用戶生產力。它內置AI代理,提供無廣告、超高速的瀏覽體驗,並支持模塊化擴展。這款瀏覽器在學術研究、商業決策和內容創作等領域展現出巨大潛力。

image.png

【AiBase提要:】

🌟 Genspark AI Browser內置AI代理,提供智能導航與內容分析,例如自動搜索全網最低價。

💻 支持MCP Store模塊化擴展,用戶可通過定製化AI工具滿足多樣化需求。

🚀 適用於多種場景,包括學術研究、商業決策及內容創作,提升信息處理與任務自動化效率。

8、麻省理工利用 AI 技術迅速修復 15 世紀名畫,僅需三個半小時

麻省理工開發出一種基於人工智能的創新修復技術,通過可拆卸的掩膜和數字地圖,大幅縮短藝術品修復時間,提高修復效率。

image.png

【AiBase提要:】

🎨 麻省理工開發新技術,通過 AI 修復名畫,僅需三個半小時。

⏳ 該技術將修復時間從數月縮短到幾個小時,大幅提高效率。

🖼️ 採用可拆卸掩膜和數字地圖,修復過程安全可逆,保護原畫。

9、螞蟻集團和Inclusion AI聯合推Ming-Omni:首個開源版多模態GPT-4o

Ming-Omni是一款由螞蟻集團和Inclusion AI聯合推出的多模態模型,具備圖像、文本、音頻及視頻處理能力,支持語音與圖像生成、多模態輸入融合處理,並開放源代碼以促進研究與發展。

image.png

【AiBase提要:】

🌟 支持多模態輸入融合處理,無需額外模型或特定任務微調,高效完成多樣化任務。

🗣️ 提供語音與圖像生成功能,支持方言理解、語音克隆及上下文感知對話,提升人機交互體驗。

🌐 首個開源多模態模型,與GPT-4o匹敵,激勵社區研究與開發,推動技術進步。

詳情鏈接:https://lucaria-academy.github.io/Ming-Omni/

10、視頻版AI換衣框架MagicTryOn,基於Wan2.1視頻模型

MagicTryOn 是一種基於大型視頻擴散變換器的虛擬試穿框架,通過創新的模型設計和服裝保留策略,在大幅度運動場景下表現出色,提升了視頻虛擬試穿的時空一致性。

image.png

【AiBase提要:】

🌟 MagicTryOn 採用擴散變換器,顯著提升視頻虛擬試穿的時空一致性。

👗 引入粗到細的服裝保留策略,增強服裝細節表現力。

🎥 在大幅度運動場景下表現優異,展現服裝與人體動作的自然互動。

詳情鏈接:https://vivocameraresearch.github.io/magictryon/

11、字節跳動Seaweed APT2震撼發佈!實時互動AI視頻生成,解鎖3D虛擬世界新紀元

字節跳動推出的Seaweed APT2是一款高效的AI視頻生成模型,具有實時視頻流生成、互動相機控制和虛擬人類生成的能力,被認爲是通往虛擬全息甲板的重要一步。

image.png

【AiBase提要:】

✨Seaweed APT2採用自迴歸對抗後訓練技術,大幅降低計算複雜性,實現高效實時視頻生成。

🎥支持實時3D世界探索和互動虛擬人類生成,適用於虛擬主播、遊戲角色等多種場景。

🌟相比傳統模型,Seaweed APT2在動作連貫性和場景多樣性方面有顯著提升,開啓AI視頻生成新篇章。

12、OpenAI升級ChatGPT Search功能,提供更精準、更智能的響應

我非常看好這次ChatGPT Search的功能升級,它不僅提升了搜索質量,還增強了用戶體驗,尤其是新增的圖片搜索和項目管理功能,讓ChatGPT變得更強大、更實用。

image.png

【AiBase提要:】

🔍 新增圖片搜索功能,支持多樣化交互方式。

📚 Projects功能升級,助力高效管理對話和文件。

🌐 挑戰谷歌霸主地位,提供更高效、人性化搜索體驗。

13、字節火山引擎澄清與老鳳祥 AI 智能眼鏡合作傳聞

本文探討了關於字節跳動旗下火山引擎與中國珠寶品牌老鳳祥合作開發AI智能眼鏡的傳聞,分析了雙方的聲明以及實際展示的功能。

image.png

【AiBase提要:】

火山引擎否認與老鳳祥合作開發AI智能眼鏡,但老鳳祥展示的眼鏡確實使用了豆包大模型。

老鳳祥AI眼鏡專爲老年用戶設計,具備多種實用功能如語音導航、實時翻譯等。

豆包大模型作爲公開產品,任何合規客戶均可購買並應用到自己的設備中。