歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、無需邀請碼!國產AI智能體Manus宣佈向所有人開放註冊

國產AI智能體平臺Manus近期開放用戶註冊,無需等待,用戶可直接註冊並獲得積分獎勵。該平臺由Monica公司推出,憑藉其通用型AI Agent的獨特魅力迅速走紅。Manus通過創新的工程架構,結合思考與行動,極大提升了用戶的創作潛力,涵蓋多個領域的任務執行,標誌着AI應用的轉變。

國產AI智能體Manus宣佈開放註冊:邀請碼曾被炒到 10 萬

【AiBase提要:】

🚀 Manus平臺現已開放註冊,用戶可每日免費執行任務並獲得積分獎勵。

🤖 Manus通過工程化創新,將思考與行動結合,支持複雜任務的執行。

🌐 與阿里通義千問團隊合作,探索國產模型與算力平臺的應用,提升用戶體驗。

2、全球首款設計Agent Lovart內測!一句話搞定Logo、視頻、品牌全套

Lovart AI推出全球首款設計Agent,集成圖像、視頻和音樂模型,顛覆傳統設計工作流。用戶通過自然語言指令可實現全鏈路自動化設計,吸引了設計師和初創企業的關注。其核心功能包括任務拆解、跨媒介內容創作及智能圖文分離,極大提升設計效率。Lovart在Beta測試階段表現出色,預計將推動AI設計工具市場的進一步發展。

【AiBase提要:】

🛠️ Lovart AI通過自然語言指令實現全鏈路自動化設計,用戶只需一句話即可完成複雜任務。

🎥 支持多模態模型集成,用戶可輕鬆生成圖像、視頻和音樂內容,提升創作靈活性。

🌐 Lovart在Beta測試階段受到熱烈反響,用戶稱讚其設計效率提升超5倍,展現出強大的市場潛力。

詳情鏈接:https://lovart.ai

3、教育部劃清AI使用邊界:小學到高中分階段引導,禁止複製AI答案

教育部發布的《中小學人工智能通識教育指南(2025年版)》和《中小學生成式人工智能使用指南(2025年版)》明確了人工智能在教育中的使用規範,強調禁止學生直接複製AI生成的內容,以防止對獨立思考能力的影響。同時,指南根據不同學段的特點,提出了分階段的使用策略,強化教師的引導職責,確保學生在安全的環境中合理使用AI工具。

【AiBase提要:】

🚫 禁止學生直接複製AI生成內容作爲作業或考試答案,防止依賴AI削弱獨立思考能力。

👩‍🏫 教師需引導學生進行批判性思維訓練,分析AI生成文本的邏輯缺陷和文化偏差。

🔒 建立AI工具白名單制度,確保校園內使用的AI工具符合教育需求和數據安全合規。

4、從圖像出發構建可控交互世界!崑崙萬維正式開源Matrix-Game

崑崙萬維集團於5月13日宣佈開源Matrix-Game大模型,這是一個專注於交互式世界生成的先進模型,標誌着該領域技術的新突破。Matrix-Game不僅是工業界首個開源的10B+空間智能大模型,還通過其三大核心部分實現了高質量生成與精確控制。

image.png

【AiBase提要:】

🛠️ Matrix-Game是首個開源的10B+空間智能大模型,專注於交互式世界生成,刷新技術上限。

📊 該模型通過GameWorld Score評測體系,從視覺質量、時序質量等四個維度全面量化性能,超越現有基線模型。

🌍 Matrix-Game具備多場景泛化能力,支持不同地形和環境,提升用戶交互體驗。

詳情鏈接:https://matrix-game-homepage.github.io

5、Google Gemma AI 模型下載量突破1.5億次

Google最近宣佈其Gemma人工智能模型集合的下載量已突破1.5億次,顯示出其在AI領域的顯著進展。Gemma是一款多模態模型,能夠處理文本和圖像,支持超過100種語言,滿足全球用戶需求。儘管下載量可觀,但仍低於競爭對手Llama的12億次下載,且因複雜的許可條款受到開發者的批評。

【AiBase提要:】

🌟 下載量突破1.5億次: Google的Gemma AI模型集合吸引了大量開發者關注,標誌着顯著進展。

🖼️ 多模態功能: Gemma支持文本和圖像處理,能夠滿足全球用戶需求,支持超過100種語言。

⚠️ 許可條款爭議: Gemma和Llama因複雜的許可條款受到批評,開發者擔心在商業使用中存在風險。

6、OpenAI推出深度研究報告一鍵導出PDF功能

OpenAI最近推出了一項新功能,允許用戶將其深度研究報告一鍵導出爲PDF格式。這一更新極大提升了報告的實用性和分享效率,特別是在企業環境中。用戶可以輕鬆生成包含引用、表格和圖片的專業文檔,從而更好地支持決策和溝通。

【AiBase提要:】

📝 新增的PDF導出功能讓用戶可以一鍵生成完整格式的深度研究報告,提升了分享效率。

🔗 該功能支持新生成和歷史報告,確保用戶可以隨時調用已有成果,增強了報告的實用性。

🚀 OpenAI通過這一更新,將尖端AI技術與企業現有工作流程無縫銜接,推動了AI工具的實用化進程。

7、字節跳動發佈統一圖像定製框架DreamO:集成換裝、換臉與風格遷移

字節跳動在Hugging Face平臺推出了DreamO,一個集成多種圖像編輯功能的全新框架,標誌着AI圖像編輯技術的重大突破。DreamO不僅支持換裝、換臉、風格遷移等功能,還通過開源特性吸引開發者參與,推動行業創新。其一站式解決方案降低了使用門檻,使得專業設計師和普通用戶都能輕鬆實現高質量的圖像編輯。

image.png

【AiBase提要:】

✨ DreamO是一款集成圖像換裝、換臉、風格遷移等多種功能的統一框架,支持多樣化的圖像編輯需求。

🔧 通過靈活的參數設置,用戶可以輕鬆實現精準的圖像編輯,降低了使用門檻,適合各種用戶。

🌍 DreamO的開源特性促進了全球開發者的參與,推動了AI圖像編輯領域的創新和應用。

詳情鏈接:https://github.com/bytedance/DreamO

8、月之暗面Kimi界面升級:氣泡樣式優化 改爲無邊界內容展示

月之暗面科技有限公司的智能助手Kimi進行了重大界面升級,旨在提升用戶體驗和信息呈現能力。此次升級引入了多模態容器,支持實時K線圖、HTML預覽和語音播報等功能,增強了用戶與Kimi的互動。儘管新界面引發了一些用戶對舊版的懷念,但公司強調這是Kimi成長的一部分,希望通過這些更新讓其成爲更強大的智能助手。

image.png

【AiBase提要:】

📈 Kimi支持實時K線圖,提供直觀的市場走勢分析。

🎤 新增語音播報功能,幫助用戶跟蹤信息。

🔧 用戶可實時查看Kimi服務狀態,增強系統透明度。

9、阿里MNN神更新!移動端開源多模態AI支持Qwen-2.5,文本圖像語音全搞定!

阿里巴巴的MNN項目發佈了新版MnnLlmApp,支持Qwen-2.5-Omni-3B和7B模型,極大增強了移動端多模態AI的能力。該應用支持多種模態任務,包括文本、圖像和音頻的生成與識別,且具備高效性能和低資源佔用,吸引了開發者的關注。

QQ20250513-094907.jpg

【AiBase提要:】

🛠️ 新版MnnLlmApp集成Qwen-2.5-Omni-3B和7B模型,支持文本、圖像、音頻等多模態任務,提升了綜合處理能力。

📱 應用完全本地運行,無需聯網,確保數據隱私,且在CPU推理上表現卓越,速度遠超同類產品。

🌐 MNN的開源屬性和對主流模型的支持,使其成爲移動端多模態AI開發的理想平臺,推動了行業的快速發展。

詳情鏈接:https://github.com/alibaba/MNN/blob/master/apps/Android/MnnLlmChat/README.md

10、ChatGPT 推出 SharePoint 連接器,企業數據分析更高效!

ChatGPT 最近推出了一項新功能,允許用戶通過 SharePoint 連接器訪問公司數據。這一功能目前正在測試中,專爲 ChatGPT Plus、Pro 和 Team 用戶設計。通過此集成,ChatGPT 可以從多個 SharePoint 站點中分析和總結內容,並提供來源引用,幫助企業在數據管理和分析方面實現更高效的工作。

image.png

【AiBase提要:】

✅ ChatGPT 通過 SharePoint 連接器,支持公司數據分析與總結。

📊 新功能適用於 ChatGPT Plus、Pro 和 Team 用戶,幫助跨部門信息整合。

🔒 數據隱私有保障,ChatGPT 僅訪問用戶有權限的數據。

11、新一代開源視覺編碼器 OpenVision 發佈:超越 CLIP 與 SigLIP 的強大選擇

加州大學聖克魯茲分校推出的OpenVision是一個全新的視覺編碼器系列,爲開發者和企業提供了靈活的選擇,旨在提升圖像處理和理解的效率。OpenVision不僅支持多種模型和靈活的部署架構,還在多模態基準測試中表現優異。

image.png

【AiBase提要:】

🔍 OpenVision提供26種不同模型,參數規模從590萬到6.32億,適應多種應用場景。

⚙️ 靈活的部署架構支持服務器級負載與邊緣計算,模型可自適應補丁大小以優化性能。

📊 在多模態基準測試中表現優異,採用漸進式訓練策略提高訓練效率,確保下游性能。

詳情鏈接:https://ucsc-vlaa.github.io/OpenVision/

12、AI 突圍!阿里雲與 DeepSeek 脫穎而出,福布斯發佈中國人工智能企業 TOP50榜單

2025年福布斯發佈的中國人工智能科技企業TOP50榜單,展現了中國在全球AI領域的崛起。隨着市場規模的快速擴張,超過4500家AI企業在智能製造、醫療、自動駕駛等領域實現了規模化應用。尤其是中西部地區企業的崛起,顯示出科技創新的突破。11家企業在大模型領域佔據主導地位,推動了生成式AI技術的商業化。

圖片

【AiBase提要:】

🚀 中國人工智能企業數量超過4500家,涵蓋多個領域,推動行業進步。

🌍 中西部地區企業入選數量顯著增加,顯示出科技創新的突破。

💡11家企業在大模型領域佔據22%市場份額,推動生成式AI技術商業化。

13.騰訊混元 T1-Vision 上線元寶 可深度理解圖片內容  

騰訊推出的 “元寶” 工具利用 Hunyuan T1-Vision 模型,能深度理解圖片內容,簡化信息獲取,提高準確性和效率。

微信截圖_20250512175402.png

【AiBase 提要:】

1. 🌸 識別植物:用戶拍照即可獲得植物的詳細信息。  

2. 🎮 遊戲輔助:翻譯遊戲界面,幫助理解角色技能。  

3. 🧠 深度思考:支持圖文切換,快速提供決策建議。