歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://app.aibase.com/zh

1、Kimi k2性能被贊超越 GPT-5,月之暗面再獲數億美元重磅融資

國內大模型明星創業公司月之暗面(Moonshot AI)即將完成新一輪數億美元的融資。此次融資距離月之暗面公開披露的上一輪約3億美元融資僅過去不久(上一次公開信息爲2024年8月),顯示出資本市場對該公司的信心再次高漲。

【AiBase提要:】

🚀 Kimi k2模型性能超越GPT-5和Claude4.5,引發全球關注。

💰 月之暗面完成數億美元融資,資本市場對其信心高漲。

🌐 Kimi k2的發佈使月之暗面重新成爲全球AI舞臺的焦點。

2、Anthropic 爲 Claude Pro/Max 用戶推出“記憶”功能,實現個性化與安全升級

Anthropic 爲其旗艦 AI 模型 Claude 的 Pro 和 Max 版本推出了全新的‘記憶’功能,旨在提升對話的一致性和個性化體驗。該功能注重隱私和隔離性,允許用戶控制記憶內容,並提供‘隱身聊天’模式以確保數據不被保存。【AiBase提要:】

🧠 記憶功能可記住項目內容、用戶偏好和工作流程,提升對話連貫性。

🔒 項目獨立記憶和用戶控制權設計,保障隱私和數據隔離。

🕵️‍♂️ 新增‘隱身聊天’模式,確保對話數據不被保存或顯示在記錄中。

3、中國科大與字節發佈 MoGA 長視頻生成模型:分鐘級多鏡頭短片一鍵生成

中國科學技術大學與字節跳動聯合發佈端到端長視頻生成模型,採用MoGA算法實現分鐘級高質量視頻生成,標誌着國產技術在全球AI競賽中取得關鍵突破。

【AiBase提要:】

🎥 生成分鐘級多鏡頭視頻,突破傳統短時限制

🧠 引入MoGA算法,優化上下文處理與算力開銷

🚀 支持影視、廣告等多領域應用,具備產業落地潛力

詳情鏈接:https://jiawn-creator.github.io/mixture-of-groups-attention/

4、騰訊發佈全新ima2.0:任務模式上線 新增「AI要點」等功能

騰訊在ima Open Day活動上正式發佈了全新升級的ima2.0版本,引入了‘任務模式’,使知識庫從簡單的搜索問答工具升級爲能夠理解複雜任務、自主拆解步驟、調用工具並完成整套流程的智能夥伴。此外,新增了‘AI要點’功能,支持多任務並行和協作共享,提升了知識管理的效率。

image.png

【AiBase提要:】

🔥 ima2.0引入‘任務模式’,實現複雜任務的自動拆解與執行。

💡 新增‘AI要點’功能,自動生成結構化摘要,快速抓住重點。

🤝 支持多任務並行與協作共享,提升知識庫的使用效率。

5、阿里夸克AI眼鏡開啓預售:支持支付寶“看一看”支付

阿里夸克AI眼鏡推出,支持支付寶支付,具備出色的外觀設計和強大的拍攝功能,滿足用戶多樣化需求。

image.png

【AiBase提要:】

📱 支持支付寶“看一看”支付,成爲國內首款集成生物識別支付的智能眼鏡。

👓 採用7.5mm超細鏡腿與超薄鏡框設計,整體重量僅42克,佩戴舒適。

📸 搭載SuperRaw超級夜景模式和雙重防抖系統,提升拍攝能力。

6、微軟 Copilot 新增羣聊、記憶與 Edge AI 模式:最多可讓32人實時協作

微軟對 Copilot 進行了秋季重大更新,新增了羣聊功能、長期記憶以及 Edge AI 模式,提升了協作性、個性化和跨服務整合能力。

【AiBase提要:】

🌟 引入“羣組”羣聊功能,支持32人實時協作與任務分配。

🧠 增加“長期記憶”功能,保存用戶關鍵信息並在後續對話中自動調用。

🌐 Edge 瀏覽器推出 Copilot 模式,提供內容分析與智能建議。

7、Opera Neon 瀏覽器推出深度研究 Agent“ODRA”

Opera Neon瀏覽器推出了全新的AI功能——Opera Deep Research Agent(ODRA),標誌着Opera在瀏覽器AI生態建設上的重要進展。ODRA通過並行化處理方式,提升了複雜問題查詢的效率和準確性,展現了與行業巨頭競爭的實力。

image.png

【AiBase提要:】

🌍 ODRA是Opera自研AI引擎的核心部分,經過兩年多的研發和優化,性能顯著提升。

⚙️ ODRA採用並行化操作,將複雜任務拆分爲多個子問題,提高研究效率。

🔍 ODRA作爲第四個Agent加入Opera Neon,用戶可通過全能搜索框啓動研究功能。

8、百度 PaddleOCR-VL 模型登頂全球 OCR 榜,連續五日領跑 Huggingface 趨勢榜

百度飛槳團隊發佈的 PaddleOCR-VL 模型在 OCR 領域引發轟動,憑藉強大的性能和多語言支持,成爲當前最受關注的開源 OCR 模型。

QQ20251024-135355.png

【AiBase提要:】

✅ PaddleOCR-VL 在 OmniDocBench V1.5評測中取得92.56分,超越主流模型登頂全球 OCR 榜單。

🌐 支持109種語言識別,可解析文本、表格、公式與圖表,並具備文檔語義結構重建能力。

🔍 百度、DeepSeek 與上海 AI Lab 等機構開源 OCR 模型,核心目標是爲大模型訓練提供數據基礎。