歡迎來到AIbase【AI日報】欄目!
每天三分鐘瞭解當日AI大事件,助你洞悉AI行業趨勢、創新AI產品應用。
更多AI資訊訪問:https://www.aibase.com/zh
1、騰訊開源輕量級混元-A13B模型1張中低端GPU卡即可部署
騰訊發佈混元大模型家族的新成員混元-A13B模型,採用專家混合(MoE)架構,總參數規模達800億,激活參數爲130億,大幅降低推理延遲與計算開銷,爲個人開發者和中小企業提供更具性價比的AI解決方案。該模型在數學、科學和邏輯推理任務中表現出色,支持調用工具生成複雜指令響應。
體驗入口:https://hunyuan.tencent.com/
開源地址:https://github.com/Tencent-Hunyuan。
2、可靈AI推出“視頻音效”功能,實現“所見即所聽”沉浸體驗
可靈AI全系列視頻模型上線“視頻音效”功能,用戶生成視頻時可同步生成立體聲音效,實現“所見即所聽”。升級的“音效生成”功能新增“視頻生音效”模塊,基於自研多模態視頻生音效模型Kling-Foley,實現音畫幀級對齊。該功能已向所有用戶限時免費開放。
3、Black Forest震撼開源FLUX.1Kontext [dev]:媲美GPT-4o的圖像編輯
Black Forest Labs開源圖像編輯模型FLUX.1Kontext [dev],基於12億參數的流匹配變換器架構,支持消費級硬件運行。其核心功能是上下文感知與精準編輯,能理解文本和圖像輸入,實現真正上下文生成與編輯,支持多次迭代編輯。
開源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
Github:https://github.com/black-forest-labs/flux。
4、OpenAI發佈Deep Research API新模型:o3/o4-mini-deep research
OpenAI推出兩款Deep Research API新模型o3-deep-research和o4-mini-deep-research,專爲高階分析和深度信息合成設計,支持自動化網頁搜索、數據分析、代碼執行等功能。定價方面,o3模型每1000次調用價格爲10至40美元,o4-mini價格更低,爲2至8美元。
5、1999元起!小米AI眼鏡顛覆智能穿戴,拍攝、支付、音樂一鏡全能!
小米推出首款人工智能穿戴產品小米AI眼鏡,具備第一人稱拍攝、語音助手和開放式耳機功能,通過電致變色技術爲用戶帶來個性化體驗。眼鏡採用輕量化設計,重量僅爲40克,配備1200萬像素前置攝像頭,支持2K30幀每秒視頻錄製和直播功能。
6、迅雷發佈下載MCP服務 一句話讓Al自動下載
迅雷推出下載MCP服務,用戶只需“一句話”就能讓AI自動完成下載任務。該服務適配PC版迅雷和NAS迅雷,目前所有用戶均可免費使用迅。雷MCP具備在國內外多個主流大模型應用接入的能力,如納米AI、釦子空間、Cursor、Cherry Studio等。
7、一鍵生成爆款視頻!HeyGen AI視頻Agent席捲內容創作界!
HeyGen推出AI視頻Agent,通過簡單素材上傳,自動完成從故事規劃、腳本編寫到鏡頭選擇的整個視頻製作流程,幾分鐘內即可獲得可直接發佈的專業級視頻內容。支持多種視頻類型,操作流程簡便,無需專業視頻編輯技能,智能化提示引導用戶輕鬆上傳素材並設定創作需求,AI完成從腳本到成片的全部工作。
8、重磅!谷歌開源Gemma3n多模態模型,手機也能跑出雲端AI性能
谷歌發佈並開源端側多模態大模型Gemma3n,爲手機、平板、筆記本等端側設備帶來強大多模態功能。提供E2B和E4B兩個版本,原始參數量分別爲5B和8B,但內存佔用僅相當於傳統2B和4B模型,分別只需2GB和3GB內存即可運行。原生支持圖像、音頻、視頻和文本的多模態輸入處理,支持140種文本語言和35種語言的多模態理解。
開源地址:https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4