歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、可靈AI今日全量上線O1 視頻大模型:統一多模態架構 支持一句話生成視頻
可靈AI公司宣佈其自主研發的O1視頻大模型已全量開放,該模型採用MVL統一交互架構,支持文字、圖像、視頻三種指令輸入,並能一次性完成文生視頻、圖生視頻、局部編輯及鏡頭延展任務。此外,模型通過多視角主體構建技術解決鏡頭切換時的“特徵漂移”問題,確保畫面連貫。目前,O1模型已在可靈App及官網同步開放體驗,後續將開放API接口供第三方平臺集成。

【AiBase提要:】
🧠 O1視頻大模型採用MVL統一交互架構,支持文字、圖像、視頻三種指令輸入
🎬 一次性完成文生視頻、圖生視頻、局部編輯及鏡頭延展任務
📊 可靈AI計劃開放API接口,供第三方平臺集成
2、千問APP接入萬相Wan2.5,視頻能力全新升級
千問APP接入萬相Wan2.5模型,顯著提升了視頻創作能力,支持音視頻同步輸出,並允許用戶通過自定義圖片和文字生成高質量的動態視頻內容,進一步降低了創作門檻,激發了用戶的創意熱情。

【AiBase提要:】
🎥 千問APP接入萬相Wan2.5模型,視頻創作能力全面升級。
🎙️ 支持音視頻同時輸出,實現音畫同步的高質量視頻生成。
🔄 用戶可自定義上傳照片和文字,生成動態唱跳視頻,降低創作門檻。
3、PixVerse V5.5 發佈:支持「導演級」音畫同步
PixVerse V5.5版本的發佈,爲視頻製作帶來了重大變革。用戶只需輸入一句話即可生成帶聲音和口型同步的高清視頻,並支持多鏡頭自動切換,顯著提升了視頻創作的便捷性。

【AiBase提要:】
🎥 支持一句話生成高清視頻,實現音畫同步。
🔄 多鏡頭自動切換,提升視頻敘事邏輯。
🚀 自研架構提升視頻生成速度與質量,一站式服務。
詳情鏈接:https://pai.video
4、DeepSeek-V3.2 正式發佈:引入創新稀疏注意力架構,API 成本腰斬,性能比肩頂尖閉源模型
中國人工智能初創公司深度求索(DeepSeek AI)發佈了DeepSeek-V3.2系列模型,包括DeepSeek-V3.2及其高計算增強版DeepSeek-V3.2-Speciale。新模型引入了創新的稀疏注意力機制(DSA),提升了長文本任務的效率,並降低了API成本。DeepSeek-V3.2-Speciale版本在高難度推理任務中表現出色,甚至超越了GPT-5。此外,該模型還提供了開源內核和演示代碼,支持研究人員和企業進行商業部署。
【AiBase提要:】
🧠 引入創新的稀疏注意力機制(DSA),提升長文本任務效率。
🚀 DeepSeek-V3.2-Speciale版本在高難度推理任務中表現優異,超越GPT-5。
📊 API成本降低50%,支持研究人員和企業進行商業部署。
詳情鏈接:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
5、Runway 發佈全新 Gen-4.5視頻生成模型,提升創作與視覺質量
Runway 發佈了其最新的視頻生成模型 Gen-4.5,顯著提升了視覺準確性和創意控制,適用於社交媒體短視頻創作。儘管面臨競爭,Gen-4.5在物體和角色的一致性質量上表現突出,但也存在因果推理和時間連貫性的問題。同時,AI生成內容的真實性問題引發行業討論,建議添加免責聲明。

【AiBase提要:】
🎥 Runway 的 Gen-4.5模型使視頻生成更具創意和視覺一致性。
📱 該模型主要針對社交媒體短視頻,與其他競爭對手針對長視頻的戰略有所不同。
⚖️ AI 生成內容的真實性問題引發了行業內部的討論,建議添加免責聲明以區分真實與虛假。
6、谷歌 AI 搜索體驗“提速”:新設計實現無縫對話,Gemini3Pro 殺入120國市場!
谷歌公司正在採取一系列舉措,旨在讓其人工智能(AI)模式和功能更加普及和易用。一方面,谷歌正在測試新的設計,以優化用戶從 AI 概覽到 AI 模式的過渡體驗;另一方面,Gemini3Pro 模型正在進行大規模國際擴張。

【AiBase提要:】
💡優化AI體驗,實現無縫對話
🌍Gemini3Pro/Nano Banana Pro拓展至120個國家和地區
🚀提升用戶在Google搜索中的AI功能
7、Lovart Touch Edit 上線:輕點即改,AI 圖像編輯進入“零蒙版”時代
Lovart 推出的 Touch Edit 功能通過自然語言指令和智能識別技術,實現了圖像編輯的高效與便捷。用戶無需手動操作即可完成複雜的圖像修改任務,顯著提升了設計效率。

【AiBase提要:】
✨ Touch Edit 核心功能:通過自然語言指令實現圖像元素的自動識別與編輯。
🧩 Select & Remix 支持多圖混搭,用戶可拖拽重組不同圖片元素。
⚙️ 技術集成:融合 GPT-4o、Flux Pro 和 Sora 等模型,提供高效的 AI 工作流。
8、螞蟻數科Agentar入選中國智能體開發賽道“第一梯隊”
螞蟻數科的Agentar平臺憑藉技術架構的完整性、產品迭代的成熟度以及在金融領域的多年沉澱,成功躋身中國智能體開發賽道的‘第一梯隊’,展現了其在AI智能體開發領域的領先地位。
【AiBase提要:】
🧠 螞蟻數科的Agentar平臺在智能體開發領域展現出領先實力。
💼 該平臺在金融領域有豐富的技術經驗與規模化落地成果。
📈 Agentar-Fin-R1推理大模型在三項金融基準測試中位列第一。
