歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、OpenAI發佈兩款多模態推理模型o4-mini、滿血版o3

OpenAI在技術直播中推出了其最新的多模態模型o4-mini和滿血版o3,這兩款模型具備同時處理文本、圖像和音頻的能力,並能調用外部工具進行復雜任務的處理。o4-mini在各項測試中表現優異,準確率高於o3,並在編程競賽中名列前茅。

image.png

【AiBase提要:】

🛠️ o4-mini和o3具備多模態處理能力,能同時處理文本、圖像和音頻,並自動調用外部工具。

📊 o4-mini在AIME2024和2025測試中準確率分別達到93.4%和92.7%,超越滿血版o3。

💻 在編程競賽中,o4-mini獲得2700分,躋身全球前200名程序員,展現出強大的編程能力。

2、微信首個AI助手 “元寶” 正式上線,可以添加爲微信好友

騰訊推出的“元寶”是首個在微信平臺上運行的AI助手,用戶可以直接在微信中搜索並添加爲好友,享受更真實的聊天體驗。元寶不僅能解析微信公衆號文章、圖片和文檔,還能進行智能互動,回答用戶的進一步提問。該助手關注用戶隱私,具備證件照自動打碼功能,雖然目前不支持語音或視頻通話。

image.png

【AiBase提要:】

🌟 微信首個 AI 助手 “元寶” 上線,用戶可直接在微信中搜索添加。

📊 元寶支持解析公衆號文章、圖片和文檔,提供智能互動。

🔒 具備隱私保護功能,支持證件照自動打碼。

3、字節發佈豆包1.5深度思考模型:多模態深度思考、延遲低

在4月17日的火山引擎 AI 創新巡展杭州站上,字節跳動發佈了豆包1.5深度思考模型,展示了其在數學、編程、科學推理及創意寫作等領域的卓越能力。該模型採用MoE架構,參數配置優越,推理成本低。結合視覺理解技術,模型能夠分析照片、輔助旅行和項目管理,並且視頻搜索能力顯著增強,提升了用戶獲取信息的便利性。

image.png

【AiBase提要:】

📈 豆包1.5模型在數學、編程等領域表現出色,採用MoE架構,參數配置優越。

🌍 新模型結合視覺理解技術,能夠分析照片,輔助旅行和項目管理,功能強大。

🎥 視頻搜索能力顯著增強,用戶可快速獲取視頻中的相關信息,使用量持續增長。

4、月之暗面Kimi開源數學定理證明模型Kimina-Prover

Kimi技術團隊發佈了Kimina-Prover的預覽版,開源了多個模型和數據集,展現出在形式化定理證明領域的出色性能。Kimina-Prover通過結合大規模強化學習與形式化推理,顯著提升了模型的推理能力和樣本效率,達到了80.7%的通過率,超越了以往最佳結果。

image.png

【AiBase提要:】

🔍 Kimina-Prover在miniF2F基準測試中達到了80.7%的通過率,超越了之前的最佳結果。

🚀 該模型結合了大規模強化學習與形式化推理,顯著提升了推理能力和樣本效率。

📚 Kimina-Prover的可解釋性強,用戶可以查看推導過程,爲理解模型行爲提供便利。

詳情鏈接:https://arxiv.org/abs/2504.11354

5、OpenAI開源超Agent:Codex CLI,五小時內破5000顆星

OpenAI最近發佈了Codex CLI,這是一款輕量級的代碼智能體工具,發佈後迅速獲得了極大的關注,僅在五小時內便突破了5000顆星的評價,預計當天將突破1萬顆星。Codex CLI具備自動生成、運行代碼、重構和測試等強大功能,極大地提升了開發者的工作效率。

image.png

【AiBase提要:】

🌟 Codex CLI 在發佈後僅5小時便獲得5000顆星評價,預計今天將突破1萬顆星。

💻 該工具可以自動生成代碼、運行代碼、重構和測試代碼,功能強大且實用。

📈 OpenAI 計劃持續推出更多智能體產品,並在探索收購 AI 編程平臺以增強競爭力。

詳情鏈接:https://github.com/openai/codex?tab=readme-ov-file

6、谷歌 Gemini Live 功能全面開放,安卓用戶迎來新體驗

谷歌最近宣佈將其 Gemini 應用中的 Gemini Live 功能免費向所有安卓用戶開放,此前該功能僅限於 Pixel9和三星 Galaxy S25用戶。Gemini Live 的強大之處在於能夠實時識別攝像頭和屏幕上的內容,爲用戶提供即時反饋和信息,極大增強了互動體驗。隨着用戶反饋積極,谷歌決定推廣這一功能,預計在未來幾周內全面上線。

image.png

【AiBase提要:】

🌟 Gemini Live 功能現已免費向所有安卓用戶開放,原本僅限於 Pixel9和 Galaxy S25用戶。

📸 該功能可以實時識別攝像頭和屏幕內容,提供即時信息和反饋,提升用戶互動體驗。

🚀 微軟同日推出類似的 AI 工具 C o p i l o t Vision,顯示出實時信息識別技術的快速進步。

7、OpenAI 擬以30億美元收購 AI 編程工具 Windsurf

OpenAI 正在與 AI 編程工具 Windsurf 展開收購談判,交易金額約爲30億美元。這一收購將成爲 OpenAI 最大的併購交易,標誌着其在 AI 開發者工具市場的重要佈局。Windsurf 是一款受歡迎的 AI 編程助手,能夠生成和解釋代碼,並已獲得超過2億美元的融資。

【AiBase提要:】

💰 OpenAI 正在與 Windsurf 進行30億美元的收購談判,若達成將成爲其最大規模的併購交易。

🚀 Windsurf 是一款廣受歡迎的 AI 編程助手,支持代碼生成和解釋,已獲得超過2億美元的融資。

📈 此次收購將增強 OpenAI 的編程能力,幫助其在競爭激烈的 AI 工具市場中佔據領先地位。

8、JetBrains 推出編碼智能體 Junie AI,助力編程與調試全新體驗

JetBrains 最近宣佈其新編碼智能體 Junie AI 已達生產就緒狀態,旨在幫助開發者更高效地進行代碼編寫與調試。Junie AI 的推出標誌着 JetBrains 在 AI 工具領域的重大進展。此外,JetBrains 還更新了其舊版 AI 助手,支持最新的 AI 模型,並增強了用戶體驗。爲了應對市場競爭,JetBrains 計劃推出免費套餐,吸引更多開發者使用其工具。

【AiBase提要:】

🤖 Junie AI 已達生產就緒狀態,專注於複雜任務的處理與調試。

📈 更新的 AI 助手支持多種最新 AI 模型,並新增多文件編輯功能。

🌐 JetBrains 將推出免費套餐,提供無限代碼補全,以滿足不同開發者的需求。

詳情鏈接:https://blog.jetbrains.com/blog/2025/04/16/jetbrains-ides-go-ai/

9、Reachy2開源人形機器人正式開售

Pollen Robotics推出的Reachy2是一款開源人形機器人,售價7萬美元,已在多所頂級大學和研究機構中得到應用。其模塊化設計和強大的AI驅動能力使其成爲人形機器人領域的先鋒,適用於多種研究和教育場景。Reachy2的開源特性和靈活的編程支持爲開發者提供了廣闊的創新空間,推動了機器人技術的進步。

image.png

【AiBase提要:】

🤖 高度仿人設計,具備7自由度手臂,能夠自然、精準地執行動作,適合多種應用場景。

🔄 模塊化與開源架構,支持Python SDK編程,開發者可根據需求擴展功能,推動技術創新。

🌍 已在全球20多個國家部署,客戶包括知名機構,展現出在醫療、零售及教育等領域的廣泛應用潛力。

10、上海人工智能實驗室推出升級版多模態大模型 “書生・萬象3.0”

上海人工智能實驗室推出的“書生・萬象3.0”是一個全新的多模態大模型,具備更強的文本和多模態輸入處理能力,表現出色。該模型在性能和用戶體驗上都有顯著提升,響應速度更快,理解能力更強,能夠滿足用戶多樣化的需求。

【AiBase提要:】

🚀 升級版“書生・萬象3.0”在多模態處理能力上有顯著提升,適用於多種應用場景。

💡 該模型在性能和用戶體驗上都有明顯進步,響應速度和理解能力均增強。

🌐 開源舉措爲開發者提供了新的平臺,鼓勵創新和應用,推動行業發展。

11、豆包深度思考和文生圖3.0模型正式開放API 對企業客戶開放

豆包大模型近期發佈了豆包1.5·深度思考模型和豆包文生圖模型3.0,正式通過火山引擎開放API,供開發者和企業客戶使用。這兩款模型在推理和圖像生成任務上表現卓越,推動了AI技術的應用與發展。深度思考模型在專業推理任務中表現突出,而文生圖模型則在圖像生成質量上有顯著提升。

【AiBase提要:】

🧠 豆包1.5·深度思考模型在專業領域推理任務中表現優異,接近全球第一梯隊水平。

🎨 豆包文生圖模型3.0實現高分辨率圖像生成,提升了創作效率,具備商業級設計能力。

🚀 兩款模型的開放API爲企業客戶提供了更高效、通用的推理與圖像生成能力,推動AI技術發展。

詳情鏈接:https://github.com/ByteDance-Seed/Seed-Thinking-v1.5