AI日報： OpenAI推出gpt-image-1圖像生成API;納米AI發佈MCP萬能工具箱;中國佔全球AI專利60%

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、OpenAI推ChatGPT新圖像生成功能API:開發者可輕鬆集成 AI 繪圖功能

OpenAI最近推出了gpt-image-1圖像生成API，開發者可以將這一先進技術輕鬆集成到各種應用中。這一功能自上線以來，吸引了大量用戶，生成了超過7億張圖像。gpt-image-1不僅支持多種圖像風格，還內置安全護欄，確保生成內容符合公司政策。此外，其合理的收費結構使得開發者能夠以低成本生成高質量圖像，標誌着AI圖像生成領域的重要進步。

【AiBase提要:】
🌟 OpenAI推出gpt-image-1圖像生成API，開發者可輕鬆集成到應用中。
🖼️ 用戶在新功能上線第一周便生成超過7億張圖像，吸引了數百萬新用戶。
💰 gpt-image-1的圖像生成成本合理，低至每張圖像2美分。

2、谷歌 Gemini 月活躍用戶突破3.5億，仍與 ChatGPT 存在差距

谷歌的人工智能聊天機器人Gemini在過去一年中實現了顯著的用戶增長，月活躍用戶數達到了3.5億，日活躍用戶數也從900萬增至3500萬。然而，與市場領先者ChatGPT的6億月活躍用戶相比，Gemini仍有差距。谷歌通過與三星的合作和產品整合，推動了Gemini的快速增長，顯示出用戶對AI聊天工具的需求正在上升。未來，谷歌如何進一步提升Gemini的用戶體驗和功能，將是其能否縮小與競爭對手差距的關鍵。

【AiBase提要:】
🌟 Gemini的月活躍用戶數已達3.5億，日活躍用戶增至3500萬。
🤖 ChatGPT的月活躍用戶爲6億，仍領先Gemini。
📈 谷歌通過與三星的合作及產品整合，推動Gemini快速增長。

3、OpenAI預測2029年收入激增至1250億美元

OpenAI近期發佈的收入預測顯示，到2029年，其總收入預計將達到1250億美元，其中AI代理業務和渠道收入將成爲主要驅動力。2023年，OpenAI的收入達到37億美元，周活躍用戶超過5億，顯示出顯著增長。公司預計未來四年將實現現金流轉正，毛利潤佔比將提升至近70%。這一系列預測吸引了投資者的關注，預計將推動OpenAI的快速發展。

【AiBase提要:】
🌟 預計到2029年，OpenAI收入將達1250億美元，AI代理業務成爲主要增長點。
📈2023年收入達37億美元，周活躍用戶超過5億，顯示出顯著增長。
💰 預計未來四年將實現現金流轉正，毛利潤佔比將提升至近70%。

4、Ostris發佈Flex.2-preview，8B參數擴散模型革新ComfyUI工作流

Ostris團隊推出了Flex.2-preview，這是一款基於8億參數的文本到圖像擴散模型，旨在優化ComfyUI工作流。該模型在圖像生成的控制能力上表現卓越，支持多種功能如圖像修補和深度控制，已在Hugging Face開源，迅速吸引了AI藝術創作社區的關注。Flex.2-preview的輕量化設計與高效推理能力，使其成爲創意設計和商業應用中的理想工具，展現了未來AI藝術創作的無限可能。

【AiBase提要:】
🎨 通用控制支持:內置線條、姿態和深度控制，精確引導生成結果，適合多種創作需求。
🖼️ 圖像修補能力:支持高級圖像修補，用戶可通過掩碼進行內容替換或修復，提升創作靈活性。
⚙️ ComfyUI集成:模型專爲ComfyUI優化，提供節點化工作流支持，簡化複雜任務配置。
詳情鏈接:https://huggingface.co/ostris/Flex.2-preview

5、英偉達推多模態LLM Describe Anything:指定特定區域生成詳細的描述

NVIDIA AI團隊推出的Describe Anything3B（DAM-3B）模型在多模態學習領域引起了廣泛關注。該模型能夠根據用戶指定的圖像或視頻區域生成詳細描述，超越了傳統圖像標註的侷限性。通過開源代碼和數據集，DAM-3B爲開發者提供了豐富資源，促進了多模態AI的研究與應用，尤其在教育、醫療和內容創作等領域展現出廣闊的前景。

【AiBase提要:】
🖌️ DAM-3B具備區域化描述能力，能夠根據用戶指定區域生成詳細描述，提升描述的精準性和豐富性。
🔓 NVIDIA開源了DAM-3B的代碼、模型權重和數據集，推動了多模態AI研究的透明性和社區協作。
🌐 模型在內容創作、智能交互和無障礙技術等多個領域展現出廣泛的應用前景，推動社會包容性進步。
詳情鏈接:https://github.com/NVlabs/describe-anything

6、納米AI發佈MCP萬能工具箱，簡化AI工具集成與調用

納米AI推出的MCP萬能工具箱旨在簡化Model Context Protocol的配置複雜性，提供一站式解決方案。該工具箱預配置了100多個MCP服務和18個常用API密鑰，支持多種功能如圖像、音頻和視頻生成。它的發佈引發了AI開發者社區的廣泛關注，社區反饋積極，認爲其高效性與易用性顯著提升了開發者的工作效率。

【AiBase提要:】
🔧 預配置100多個MCP服務，開發者無需手動配置即可直接調用，降低接入門檻。
🔑 內置18個常用API密鑰，用戶可省去自行獲取密鑰的繁瑣步驟，簡化初始配置。
🌐 支持多模態生成，通過自然語言指令生成圖像、音頻和視頻，提升創作效率。
詳情鏈接:https://bot.n.cn/download?src=AIBotCode

7、騰訊雲代碼助手CodeBuddy推出Craft軟件開發智能體

騰訊雲於4月24日發佈了全新升級的代碼助手CodeBuddy，推出Craft軟件開發智能體。此工具將AI編程從簡單的代碼補全提升至項目交付，顯著提高了開發效率。開發者只需用自然語言輸入需求，Craft便能自動生成完整的項目代碼，並支持主流IDE。Craft還支持MCP協議，實現代碼的無縫接入測試、構建和部署，兼容騰訊生態系統，助力團隊高效協作。

【AiBase提要:】
🚀 Craft智能體能將開發者的自然語言需求轉化爲完整的項目代碼，極大簡化開發流程。
🔗 支持MCP協議，使得AI生成的代碼能夠無縫接入測試和部署環節，提高了開發的連貫性。
🧩 CodeBuddy已在騰訊內部廣泛應用，85%的開發者使用該工具，顯著提升了整體開發效率。
詳情鏈接:https://cnb.cool

8、崑崙萬維開源Skywork-R1V2.0版本

崑崙萬維於4月24日發佈了其多模態推理模型Skywork-R1V2.0，顯著提升了視覺與文本推理能力，尤其在高考理科難題和通用任務場景中表現優異。該模型在多個權威基準測試中刷新了開源SOTA紀錄，展現出與商業閉源模型相媲美的能力。R1V2.0的開源不僅體現了崑崙萬維在多模態領域的技術實力，也爲全球開發者和研究者提供了強大的工具，推動了多模態生態的建設。

【AiBase提要:】
🔍 R1V2.0在中文理科題目推理方面表現突出，成爲免費AI解題助手，刷新多個開源SOTA紀錄。
⚙️ 採用多模態獎勵模型Skywork-VL Reward和混合偏好優化機制，提升模型在多任務、多領域下的適應能力。
🌍 崑崙萬維致力於推動開源和創新，R1V2.0的開源爲AGI的發展提供了新的基座模型，未來將繼續推出領先的大模型與數據集。
詳情鏈接:https://github.com/SkyworkAI/Skywork-R1V

9、智譜宣佈旗下多款大模型產品降價其中GLM-4-Plus降價90%

智譜BigModel開放平臺於4月24日宣佈其多款大模型產品價格大幅調整，進入了“億時代”，使企業能夠以低成本接觸到先進的AI技術。此次調整包括GLM-4-FlashX、GLM-Z1系列和GLM-4-Plus等多個產品，特別是GLM-4-Plus的降價幅度高達90%。這一舉措旨在降低使用門檻，滿足金融、互聯網、教育等多個行業的需求，推動市場對大模型技術的廣泛應用。

【AiBase提要:】
🚀 GLM-4-FlashX模型每億tokens價格僅爲10元，推理速度與GPT-4相當，表現優異。
💡 GLM-Z1-AirX推理速度是DeepSeek-R1的8倍，性價比高，GLM-Z1-Air價格僅爲DeepSeek-R1的1/30。
📉 GLM-4-Plus價格降至5元/百萬tokens，行業領先，滿足多行業場景需求。

10、JSON Visuals for ChatGPT發佈，解鎖無限圖像風格創作

JSON Visuals for ChatGPT的發佈爲圖像生成帶來了全新的創意維度，用戶可以利用超過50種美學代碼和隨機化器，輕鬆生成個性化的視覺內容。該工具不僅提升了生成的靈活性，還支持高分辨率輸出，適用於數字藝術、品牌營銷、遊戲設計等多個領域。社區反饋積極，期待未來的功能優化和擴展。

【AiBase提要:】
✨50+美學代碼，支持多樣化風格生成，滿足創作需求。
🔄 屬性隨機化器，自動調整風格屬性，探索創意無限可能。
🚀 高兼容性，快速生成高分辨率圖像，提升用戶體驗。
詳情鏈接:https://json.visuals.zip/

11、國家知識產權局:中國成爲全球AI專利最大擁有國，佔比達60%

在國務院新聞辦公室的發佈會上，國家知識產權局局長申長雨宣佈，中國在人工智能領域展現出強勁的發展勢頭，已成爲全球AI專利的最大擁有國，專利數量佔全球總量的60%。這一成就不僅反映了科技創新的突破，也彰顯了中國在新興產業中的領導地位。國家知識產權局積極推動相關知識產權制度的創新，以支持人工智能技術的發展，並致力於完善知識產權保護規則，提升保護和運用水平。

【AiBase提要:】
🌟 中國在全球人工智能專利中佔據60%份額，成爲最大擁有國。
⚙️ 國家知識產權局推出多項政策，支持人工智能技術的快速發展與應用。
📈2024年知識產權授權數據喜人，社會滿意度提升至82.36分。

12、199元!小米新款智能音箱發佈:AI大模型加持，智能對話再升級

小米新款智能音箱以199元的親民價格正式發佈，雖然在硬件配置上相比Pro版有所精簡，但其AI大模型的引入使得智能交互體驗得到了顯著提升。新音箱支持連續對話與指令語控，用戶能夠更高效地操控智能家居。同時，新增的遠程備車功能也爲用戶提供了更爲便捷的出行體驗。整體來看，這款音箱在性價比和智能化方面都表現出色，適合追求便捷生活的用戶。

【AiBase提要:】
🎨 外觀設計延續Pro版簡約風格，採用清爽淺灰色外殼，尺寸更小巧。
🔧 功能上有所取捨，取消紅外遙控和Type-C音頻連接，但聲學配置依然出色。
🤖 AI大模型加持，支持連續對話和遠程備車功能，智能交互體驗顯著提升。

AI日報： OpenAI推出gpt-image-1圖像生成API;納米AI發佈MCP萬能工具箱;中國佔全球AI專利60%

相關推薦

OpenAI 正式在 ChatGPT 中推出廣告服務，Best Buy 等已率先試水

OpenAI擴大ChatGPT家長通知，青少年暴力違規將觸發提醒

ChatGPT突發重大服務故障，正值GPT-5. 6 系列模型上線關鍵期

GPT-5. 6 上線引爆需求：奧爾特曼稱上週OpenAI智能體產品用量增長2. 5 倍

歐盟出手“破冰”!ChatGPT 攜 GPT-5.5強勢重返歐洲 WhatsApp