歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、Moonshot AI發佈Kimi-Audio:開源音頻基礎模型樹立新標杆

Moonshot AI最近推出的Kimi-Audio是一款開源音頻基礎模型,旨在推動音頻理解、生成和交互技術的發展。該模型基於Qwen2.5-7B架構,結合Whisper技術,支持多種音頻任務,如語音識別和音頻問答。憑藉超過13億小時的多樣化音頻數據訓練,Kimi-Audio在多項基準測試中表現出色,超越了現有模型。

QQ20250427-090033.png

【AiBase提要:】

🎤 Kimi-Audio具備強大的多功能音頻處理能力,支持語音識別、音頻問答等多項任務。

📊 該模型在超過13億小時的多樣化音頻數據上進行訓練,展現了卓越的性能表現。

🌍 Kimi-Audio的開源策略降低了音頻AI技術的使用門檻,促進了全球AI技術的民主化進程。

詳情鏈接:https://github.com/MoonshotAI/Kimi-Audio

2、階躍星辰開源圖像生成模型Step1X-Edit:開源圖像編輯新標杆

Step1X-Edit是由Stepfun AI團隊推出的開源圖像編輯模型,結合了多模態大語言模型與擴散變換器,展現出強大的圖像生成能力。其開源特性和高性能表現吸引了業界的廣泛關注,尤其是在GEdit-Bench基準測試中表現優異。該模型爲內容創作者和開發者提供了強大的工具,推動了圖像編輯技術的發展。

QQ_1745715180413.png

【AiBase提要:】

🚀: Step1X-Edit結合多模態大語言模型與擴散變換器,能高效生成高質量圖像。

📊: GEdit-Bench基準測試顯示其性能超越現有開源模型,接近閉源模型水平。

💡: 開源特性爲研究和開發提供了基礎,推動了圖像編輯技術的創新與普及。

詳情鏈接:https://huggingface.co/spaces/stepfun-ai/Step1X-Edit

3、夸克AI超級框升級 上線“拍照問夸克”功能:啥都能答

阿里巴巴旗下的夸克AI超級框於4月25日推出了“拍照問夸克”功能,這一創新利用視覺理解和推理模型,能夠快速識別和理解用戶在現實生活中遇到的各種問題。用戶通過拍照可以獲取準確的信息和答案,涵蓋多個領域,包括文物講解、商品識別、健康分析等。

image.png

【AiBase提要:】

📸 新功能“拍照問夸克”基於視覺理解,能快速識別圖片中的內容並提供相關信息。

🛒 用戶可以通過上傳商品圖片直接跳轉到淘寶同款鏈接,提升購物體驗。

🌍 該功能支持多種語言提問和翻譯,適用於旅行、健康、工作等多個場景。

4、國行版蘋果AI智能要來了?iOS18.5正式版預計5月份推送

蘋果公司即將在5月向中國用戶推送iOS18.5正式版更新,帶來備受關注的Apple智能功能。這一功能已在其他地區上線,中國用戶等待了近一個月。Apple智能是一套基於個人場景的AI系統,提供多樣化服務,包括照片消除和智能回覆等。然而,只有iPhone15Pro系列及即將發佈的iPhone16全系機型支持該功能,且用戶需確保設備有足夠的存儲空間。

image.png

【AiBase提要:】

🆕 Apple智能功能將於5月正式推送給中國用戶,標誌着蘋果進入生成式AI時代。

📸 該功能包括照片消除、通知摘要和智能回覆等多樣化服務,但僅支持iPhone15Pro及以上機型。

💾 用戶需確保設備至少有7GB可用存儲空間,這對部分用戶的存儲管理可能帶來挑戰。

5、谷歌AI發佈601個真實世界的生成式AI應用案例,涵蓋各行業

谷歌雲最近發佈了一份報告,展示了601個來自全球頂尖企業的生成式AI應用案例,顯示出這一技術的快速發展和廣泛應用。相比去年僅有的101個案例,增長了六倍,涵蓋了汽車、金融、醫療等多個行業。這些案例不僅突顯了生成式AI在運營和戰略中的重要性,還展示了其作爲組織結構一部分的潛力。

image.png

【AiBase提要:】

🔍601個生成式AI應用案例展示了技術在各行業的廣泛應用,較去年增長六倍。

💼 AI代理分類清晰,展示了AI在客戶服務、內部生產力和安全等方面的多重角色。

🚀 各行業的實際應用案例凸顯了生成式AI從實驗走向生產的重要趨勢。

詳情鏈接:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

6、微軟發佈全新Agent操作系統UFO² ,深度整合Windows與智能自動化

微軟近期推出的UFO²版本在自動化領域帶來了顯著進步,特別是在與Windows系統的深度集成方面。新版本能夠直接調用Windows的原生API,極大提升了自動化任務的執行效率。與OpenAI的Operator相比,UFO²在多個測試場景中的成功率明顯更高,尤其在處理複雜任務和跨應用操作時表現出色。

image.png

【AiBase提要:】

🚀 UFO²與Windows系統深度集成,能直接調用原生API,提升自動化效率。

📊 UFO²的自動化任務成功率顯著高於OpenAI的Operator,表現出色。

🖥️ 新增的畫中畫模式實現自動化任務與用戶操作的隔離,提升用戶體驗。

詳情鏈接:https://github.com/microsoft/UFO?tab=readme-ov-file

7、OpenAI 推出 ChatGPT 新版本:更智能、更直觀的 GPT-4o

OpenAI 最近對其 ChatGPT 的 GPT-4o 版本進行了重要更新,重點在於如何更好地保存記憶以及提升在科學、技術、工程和數學(STEM)領域的技能。新版本旨在引導對話更有效地朝着富有成效的結果發展,同時提升模型的智能水平和人格特質。儘管存在某些“光滑”過度的問題,OpenAI 承諾未來將進行改進。此外,開發者可以選擇新的 GPT-4.1系列,以獲得更穩定的 API 體驗。

【AiBase提要:】

🌟 更新的 GPT-4o 版本在記憶保存和 STEM 技能方面進行了優化。

🤖 OpenAI 承認模型在某些情況下存在 “光滑” 過度的問題,未來將改進。

🔧 開發者可選擇新推出的 GPT-4.1系列,以獲得更穩定的 API 體驗。

8、Ema推新型語言模型EmaFusion:成本和準確性方面擊敗了 O3、Gemini

Ema公司推出了新型語言模型EmaFusion,聲稱在成本和準確性上超越了多款知名AI模型。EmaFusion採用“級聯”判斷系統,能夠動態平衡成本與準確性,並允許用戶根據任務需求進行微調。其準確率達到94.3%,運行成本顯著降低,成爲企業AI發展的新選擇。

image.png

【AiBase提要:】

🌟 EmaFusion 的準確率達到94.3%,成本是市場平均水平的四分之一。

💡 EmaFusion 能夠智能拆解複雜任務,並將其分配給最適合的 AI 模型。

🚀 Ema 正與 KPMG、Hitachi 等全球領軍企業合作,推動企業 AI 的發展。

詳情鏈接:https://www.ema.co/emafusion

9、Liquid AI推出Hyena Edge,開創智能手機邊緣設備的新時代

Liquid AI近期推出了新型卷積模型Hyena Edge,旨在爲智能手機及邊緣設備提供更高效的人工智能解決方案。該模型在計算效率和內存使用上超越了傳統的Transformer++模型,尤其適合資源受限的環境。Hyena Edge在多個標準語言模型基準測試中表現出色,展示了自動化架構設計的潛力,並計劃在未來開源,推動技術普及。

image.png

【AiBase提要:】

🌟 Hyena Edge 是Liquid AI公司推出的新型卷積模型,專爲智能手機等邊緣設備設計。

🚀 該模型在計算效率和內存使用上優於傳統的 Transformer++ 模型,適合資源受限的環境。

📈 Hyena Edge 在多個標準語言模型基準測試中表現卓越,並計劃在未來開源以促進技術普及。

詳情鏈接:https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices

10、LemonAI 推出實時音視頻 AI 數字人模型 Slice Live

LemonAI 最近推出了其創新產品 Slice Live,這是一款全球首創的實時音視頻 AI 模型。用戶只需上傳一張照片,即可與虛擬角色進行實時視頻通話。Slice Live 採用先進的 Transformer 模型,以每秒25幀的速度渲染每個像素,確保畫面流暢且真實。該產品在娛樂和教育領域都展示了巨大的潛力,未來還將擴展到 AR、VR 和元宇宙應用,同時重視用戶隱私和數據安全。

【AiBase提要:】

📸 用戶只需上傳一張照片,即可與虛擬角色進行實時視頻通話。

🎭 Slice Live 在娛樂和教育領域提供沉浸式互動體驗,帶來生動的學習內容。

🔒 LemonAI 承諾持續探索隱私保護,確保用戶數據安全。

11、智譜與生數科技達成戰略合作 專注大模型聯合創新

4月27日,清華大學旗下的智譜與生數科技宣佈達成重大戰略合作,旨在通過雙方在大語言模型和多模態生成模型的技術積累,共同推進國產大模型的技術創新與產業落地。此次合作涵蓋聯合研發、產品聯動、解決方案整合等多個方面,雙方將聚焦多個行業,推動AI技術的應用與發展,展示了國產大模型在技術創新和產業應用方面的巨大潛力。

image.png

【AiBase提要:】

🤖 智譜與生數科技將聯合研發大語言模型和多模態生成模型,推動技術創新。

📈 雙方的合作將整合各自的技術特長,打造更具競爭力的行業解決方案。

🌐 合作將聚焦政企服務、文化旅遊等領域,共同推動AI技術的規模化應用。

12、寶馬中國宣佈新車型接入DeepSeek 含5系、全新X3

寶馬中國在第三季度將推出搭載DeepSeek技術的新車型,標誌着其在智能車載系統方面的重要進步。此技術將應用於第九代操作系統的多款新車,增強車主與車輛的互動體驗。用戶可通過BMW智能個人助理以自然語言進行交流,系統能夠理解並響應口語化指令,提供便捷的駕駛體驗。

【AiBase提要:】

🚗 寶馬將在第三季度推出搭載DeepSeek技術的新車型,提升車載智能交互體驗。

🗣️ 用戶可通過BMW智能個人助理以自然語言進行交流,系統能理解口語化指令。

🌟 DeepSeek技術旨在增強用戶與車輛的互動,提供更便捷的駕駛體驗。