歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、OpenAI推ChatGPT新圖像生成功能API:開發者可輕鬆集成 AI 繪圖功能

OpenAI最近推出了gpt-image-1圖像生成API,開發者可以將這一先進技術輕鬆集成到各種應用中。這一功能自上線以來,吸引了大量用戶,生成了超過7億張圖像。gpt-image-1不僅支持多種圖像風格,還內置安全護欄,確保生成內容符合公司政策。此外,其合理的收費結構使得開發者能夠以低成本生成高質量圖像,標誌着AI圖像生成領域的重要進步。

image.png

【AiBase提要:】

🌟 OpenAI推出gpt-image-1圖像生成API,開發者可輕鬆集成到應用中。

🖼️ 用戶在新功能上線第一周便生成超過7億張圖像,吸引了數百萬新用戶。

💰 gpt-image-1的圖像生成成本合理,低至每張圖像2美分。

2、谷歌 Gemini 月活躍用戶突破3.5億,仍與 ChatGPT 存在差距

谷歌的人工智能聊天機器人Gemini在過去一年中實現了顯著的用戶增長,月活躍用戶數達到了3.5億,日活躍用戶數也從900萬增至3500萬。然而,與市場領先者ChatGPT的6億月活躍用戶相比,Gemini仍有差距。谷歌通過與三星的合作和產品整合,推動了Gemini的快速增長,顯示出用戶對AI聊天工具的需求正在上升。未來,谷歌如何進一步提升Gemini的用戶體驗和功能,將是其能否縮小與競爭對手差距的關鍵。

【AiBase提要:】

🌟 Gemini的月活躍用戶數已達3.5億,日活躍用戶增至3500萬。

🤖 ChatGPT的月活躍用戶爲6億,仍領先Gemini。

📈 谷歌通過與三星的合作及產品整合,推動Gemini快速增長。

3、OpenAI預測2029年收入激增至1250億美元

OpenAI近期發佈的收入預測顯示,到2029年,其總收入預計將達到1250億美元,其中AI代理業務和渠道收入將成爲主要驅動力。2023年,OpenAI的收入達到37億美元,周活躍用戶超過5億,顯示出顯著增長。公司預計未來四年將實現現金流轉正,毛利潤佔比將提升至近70%。這一系列預測吸引了投資者的關注,預計將推動OpenAI的快速發展。

【AiBase提要:】

🌟 預計到2029年,OpenAI收入將達1250億美元,AI代理業務成爲主要增長點。

📈2023年收入達37億美元,周活躍用戶超過5億,顯示出顯著增長。

💰 預計未來四年將實現現金流轉正,毛利潤佔比將提升至近70%。

4、Ostris發佈Flex.2-preview,8B參數擴散模型革新ComfyUI工作流

Ostris團隊推出了Flex.2-preview,這是一款基於8億參數的文本到圖像擴散模型,旨在優化ComfyUI工作流。該模型在圖像生成的控制能力上表現卓越,支持多種功能如圖像修補和深度控制,已在Hugging Face開源,迅速吸引了AI藝術創作社區的關注。Flex.2-preview的輕量化設計與高效推理能力,使其成爲創意設計和商業應用中的理想工具,展現了未來AI藝術創作的無限可能。

image.png

【AiBase提要:】

🎨 通用控制支持:內置線條、姿態和深度控制,精確引導生成結果,適合多種創作需求。

🖼️ 圖像修補能力:支持高級圖像修補,用戶可通過掩碼進行內容替換或修復,提升創作靈活性。

⚙️ ComfyUI集成:模型專爲ComfyUI優化,提供節點化工作流支持,簡化複雜任務配置。

詳情鏈接:https://huggingface.co/ostris/Flex.2-preview

5、英偉達推多模態LLM Describe Anything:指定特定區域生成詳細的描述

NVIDIA AI團隊推出的Describe Anything3B(DAM-3B)模型在多模態學習領域引起了廣泛關注。該模型能夠根據用戶指定的圖像或視頻區域生成詳細描述,超越了傳統圖像標註的侷限性。通過開源代碼和數據集,DAM-3B爲開發者提供了豐富資源,促進了多模態AI的研究與應用,尤其在教育、醫療和內容創作等領域展現出廣闊的前景。

【AiBase提要:】

🖌️ DAM-3B具備區域化描述能力,能夠根據用戶指定區域生成詳細描述,提升描述的精準性和豐富性。

🔓 NVIDIA開源了DAM-3B的代碼、模型權重和數據集,推動了多模態AI研究的透明性和社區協作。

🌐 模型在內容創作、智能交互和無障礙技術等多個領域展現出廣泛的應用前景,推動社會包容性進步。

詳情鏈接:https://github.com/NVlabs/describe-anything

6、納米AI發佈MCP萬能工具箱,簡化AI工具集成與調用

納米AI推出的MCP萬能工具箱旨在簡化Model Context Protocol的配置複雜性,提供一站式解決方案。該工具箱預配置了100多個MCP服務和18個常用API密鑰,支持多種功能如圖像、音頻和視頻生成。它的發佈引發了AI開發者社區的廣泛關注,社區反饋積極,認爲其高效性與易用性顯著提升了開發者的工作效率。

6388108570168340928723655.jpg

【AiBase提要:】

🔧 預配置100多個MCP服務,開發者無需手動配置即可直接調用,降低接入門檻。

🔑 內置18個常用API密鑰,用戶可省去自行獲取密鑰的繁瑣步驟,簡化初始配置。

🌐 支持多模態生成,通過自然語言指令生成圖像、音頻和視頻,提升創作效率。

詳情鏈接:https://bot.n.cn/download?src=AIBotCode

7、騰訊雲代碼助手CodeBuddy推出Craft軟件開發智能體

騰訊雲於4月24日發佈了全新升級的代碼助手CodeBuddy,推出Craft軟件開發智能體。此工具將AI編程從簡單的代碼補全提升至項目交付,顯著提高了開發效率。開發者只需用自然語言輸入需求,Craft便能自動生成完整的項目代碼,並支持主流IDE。Craft還支持MCP協議,實現代碼的無縫接入測試、構建和部署,兼容騰訊生態系統,助力團隊高效協作。

image.png

【AiBase提要:】

🚀 Craft智能體能將開發者的自然語言需求轉化爲完整的項目代碼,極大簡化開發流程。

🔗 支持MCP協議,使得AI生成的代碼能夠無縫接入測試和部署環節,提高了開發的連貫性。

🧩 CodeBuddy已在騰訊內部廣泛應用,85%的開發者使用該工具,顯著提升了整體開發效率。

詳情鏈接:https://cnb.cool

8、崑崙萬維開源Skywork-R1V2.0版本

崑崙萬維於4月24日發佈了其多模態推理模型Skywork-R1V2.0,顯著提升了視覺與文本推理能力,尤其在高考理科難題和通用任務場景中表現優異。該模型在多個權威基準測試中刷新了開源SOTA紀錄,展現出與商業閉源模型相媲美的能力。R1V2.0的開源不僅體現了崑崙萬維在多模態領域的技術實力,也爲全球開發者和研究者提供了強大的工具,推動了多模態生態的建設。

image.png

【AiBase提要:】

🔍 R1V2.0在中文理科題目推理方面表現突出,成爲免費AI解題助手,刷新多個開源SOTA紀錄。

⚙️ 採用多模態獎勵模型Skywork-VL Reward和混合偏好優化機制,提升模型在多任務、多領域下的適應能力。

🌍 崑崙萬維致力於推動開源和創新,R1V2.0的開源爲AGI的發展提供了新的基座模型,未來將繼續推出領先的大模型與數據集。

詳情鏈接:https://github.com/SkyworkAI/Skywork-R1V

9、智譜宣佈旗下多款大模型產品降價 其中GLM-4-Plus降價90%

智譜BigModel開放平臺於4月24日宣佈其多款大模型產品價格大幅調整,進入了“億時代”,使企業能夠以低成本接觸到先進的AI技術。此次調整包括GLM-4-FlashX、GLM-Z1系列和GLM-4-Plus等多個產品,特別是GLM-4-Plus的降價幅度高達90%。這一舉措旨在降低使用門檻,滿足金融、互聯網、教育等多個行業的需求,推動市場對大模型技術的廣泛應用。

6388109073699302485969311.png

【AiBase提要:】

🚀 GLM-4-FlashX模型每億tokens價格僅爲10元,推理速度與GPT-4相當,表現優異。

💡 GLM-Z1-AirX推理速度是DeepSeek-R1的8倍,性價比高,GLM-Z1-Air價格僅爲DeepSeek-R1的1/30。

📉 GLM-4-Plus價格降至5元/百萬tokens,行業領先,滿足多行業場景需求。

10、JSON Visuals for ChatGPT發佈,解鎖無限圖像風格創作

JSON Visuals for ChatGPT的發佈爲圖像生成帶來了全新的創意維度,用戶可以利用超過50種美學代碼和隨機化器,輕鬆生成個性化的視覺內容。該工具不僅提升了生成的靈活性,還支持高分辨率輸出,適用於數字藝術、品牌營銷、遊戲設計等多個領域。社區反饋積極,期待未來的功能優化和擴展。

【AiBase提要:】

✨50+美學代碼,支持多樣化風格生成,滿足創作需求。

🔄 屬性隨機化器,自動調整風格屬性,探索創意無限可能。

🚀 高兼容性,快速生成高分辨率圖像,提升用戶體驗。

詳情鏈接:https://json.visuals.zip/

11、國家知識產權局:中國成爲全球AI專利最大擁有國,佔比達60%

在國務院新聞辦公室的發佈會上,國家知識產權局局長申長雨宣佈,中國在人工智能領域展現出強勁的發展勢頭,已成爲全球AI專利的最大擁有國,專利數量佔全球總量的60%。這一成就不僅反映了科技創新的突破,也彰顯了中國在新興產業中的領導地位。國家知識產權局積極推動相關知識產權制度的創新,以支持人工智能技術的發展,並致力於完善知識產權保護規則,提升保護和運用水平。

【AiBase提要:】

🌟 中國在全球人工智能專利中佔據60%份額,成爲最大擁有國。

⚙️ 國家知識產權局推出多項政策,支持人工智能技術的快速發展與應用。

📈2024年知識產權授權數據喜人,社會滿意度提升至82.36分。

12、199元!小米新款智能音箱發佈:AI大模型加持,智能對話再升級

小米新款智能音箱以199元的親民價格正式發佈,雖然在硬件配置上相比Pro版有所精簡,但其AI大模型的引入使得智能交互體驗得到了顯著提升。新音箱支持連續對話與指令語控,用戶能夠更高效地操控智能家居。同時,新增的遠程備車功能也爲用戶提供了更爲便捷的出行體驗。整體來看,這款音箱在性價比和智能化方面都表現出色,適合追求便捷生活的用戶。

image.png

【AiBase提要:】

🎨 外觀設計延續Pro版簡約風格,採用清爽淺灰色外殼,尺寸更小巧。

🔧 功能上有所取捨,取消紅外遙控和Type-C音頻連接,但聲學配置依然出色。

🤖 AI大模型加持,支持連續對話和遠程備車功能,智能交互體驗顯著提升。