歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、千問PC端上線AI語音輸入,各類應用裏“開口”直接用

千問PC端上線AI語音輸入功能,用戶可通過快捷鍵在各類桌面應用中直接使用,具備強大的語義解析能力,能夠處理口語內容並進行結構化整理,同時支持語音指令完成多種辦公任務,極大提升了工作效率。

image.png

【AiBase提要:】

🗣️ 千問語音輸入支持口語內容去語氣詞、糾錯、格式化整理等,能基於上下文智能回覆。

📝 用戶可通過語音指令在各類應用中直接使用千問進行創作、問答、翻譯等操作。

📧 千問可自動生成郵件回覆,適應釘釘、微信或郵件場景,提升辦公效率。

2、字節跳動發佈全模態大模型Doubao-Seed-2.0-lite,AI能聽會看還能直接“上手”幹活

字節跳動旗下火山引擎發佈的Doubao-Seed-2.0-lite大模型,實現了視頻、圖像、音頻與文本的原生統一理解,標誌着其在多模態交互領域的重要進展。該模型在視覺與邏輯推理能力上表現突出,尤其在物理、醫療等高階學科的複雜推理測試中性能超越了之前的Pro版本。此外,它還首次實現了GUI理解與執行的一體化,能夠完成點擊、拖拽、輸入等操作,展現了強大的AI能力。

image.png

【AiBase提要:】

✅ 實現視頻、圖像、音頻與文本的原生統一理解

🧠 在物理、醫療等高階學科的複雜推理測試中性能超越Pro版本

🖱️ 首次實現GUI理解與執行的一體化,能完成點擊、拖拽、輸入等操作

3、騰訊發佈OpenSearch-VL:開源多模態深度搜索 agent 的“全家桶”方案

騰訊混元聯合多所高校發佈OpenSearch-VL,這是一個開源的多模態深度搜索智能體方案,通過強化學習技術提升模型能力。文章詳細介紹了其創新的數據生產流程、強大的工具環境以及故障感知算法,實驗表現優異,已計劃全量開源,推動多模態智能體研究發展。

image.png

【AiBase提要:】

🧠 創新數據生產線,克服“搜索捷徑”

🛠 強大的工具箱:不僅僅是搜索

🔄 “故障感知”算法:讓模型從失敗中學習

詳情鏈接:https://arxiv.org/pdf/2605.05185

4、月之暗面申請註冊KimiClaw商標 或有硬件大動作?

月之暗面近期提交了多枚“KimiClaw”商標註冊申請,涵蓋科學儀器、網站服務和通訊服務等多個核心領域,表明其在人工智能生態鏈上的野心逐步顯露。公司成立於2023年,由楊植麟創辦,專注於通用人工智能領域,並已獲得20億美元融資,估值有望突破200億美元。

【AiBase提要:】

🧠 月之暗面申請註冊“KimiClaw”商標,涉及科學儀器、網站服務及通訊服務領域。

🚀 公司成立時間短,但已獲得20億美元融資,估值有望突破200億美元。

🔍 商標佈局可能預示公司從軟件算法向硬件設備或物理交互產品延伸的野心。

5、Mininglamp 開源 Cider+Mano-P,讓你的 Mac 變身私有 AI 工作站

Mininglamp 開源了 Cider 和 Mano-P 兩個本地 AI 項目,分別解決 Mac 端側推理加速和 GUI 智能體操作問題,爲用戶打造完整的本地 AI 工作站,提升效率並保障隱私安全。

image.png

【AiBase提要:】

🧠 Cider 優化 M 系列芯片性能,提升 LLM/VLM 推理速度和效率。

🖱️ Mano-P 實現純視覺 GUI 操作,支持複雜桌面任務自動化。

🔒 兩大項目結合,構建本地私有 AI 基礎設施,保障隱私安全。

6、OpenAI攜手硬件巨頭髮布MRC協議,欲終結GPU閒置浪費

OpenAI攜手AMD、英特爾、微軟及英偉達等企業推出全新開放網絡協議MRC,旨在解決超大規模AI集羣的效率瓶頸,提升數據傳輸穩定性並減少GPU閒置浪費,推動算力集羣向更高效、綠色的方向發展。

【AiBase提要:】

🧠 MRC協議旨在優化大型AI訓練集羣的運行表現,提升數據傳輸穩定性。

⚡ 通過多路徑連接方案降低GPU閒置浪費,提高計算效率。

🌐 OpenAI聯合多家行業巨頭髮布MRC協議,推動超大規模算力集羣進入高效、綠色新階段。

7、谷歌更新AI搜索功能:集成Reddit與社交媒體一手觀點

谷歌對其生成式AI搜索功能進行了重大升級,通過整合社交媒體、論壇及新聞訂閱等一手信息源,優化用戶獲取信任資訊的效率。此次更新引入了“觀點預覽”功能,將Reddit和各類網絡論壇的真實在線對話與用戶查詢直接關聯,同時在AI回覆中嵌入專家建議,並添加創作者名稱和社區暱稱以增強信源可靠性。

【AiBase提要:】

🧠 引入“觀點預覽”功能,將Reddit和網絡論壇的真實對話與用戶查詢直接關聯。

📊 在AI回覆中嵌入專家建議,並添加創作者名稱和社區暱稱以增強信源可靠性。

🌐 增設延伸鏈接和建議主題,鼓勵用戶從單一搜索向深度研究轉變。

8、xAI 發佈 Grok Imagine 質量模式 API:視覺生成邁入寫實新紀元

xAI 公司正式推出 Grok Imagine API 的“質量模式”,在畫面寫實度、文字渲染精度和創意控制力方面實現重大突破,標誌着圖像生成邁入寫實新紀元。

【AiBase提要:】

🖼️ 提升圖像的細膩程度,捕捉自然的皮膚紋理、毛孔細節以及複雜的光影變化。

✍️ 解決了圖像生成模型在處理複雜文本時的字符錯誤或排版混亂問題。

🚀 增強視頻生成能力,品牌方可以更高效地產出社交媒體資產、產品展示短片及各類商業廣告。