AI日報：微軟必應推出全新視頻創作工具；小米將多枚Kimi商標轉讓給月之暗面；谷歌推AI Edge Gallery應用

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、小米將多枚“Kimi” 商標轉讓給月之暗面

小米將“Kimi”商標轉讓給專注於AI助手的月之暗面，此舉可能是小米優化資源的戰略調整，同時助力月之暗面拓展其智能助手業務。

【AiBase提要:】
🌟 小米將多枚‘Kimi’商標轉讓給北京月之暗面科技有限公司，優化非核心商標資源。
🤖 月之暗面推出的Kimi智能助手於2023年上線，此次商標轉讓爲其發展提供支持。
🔍 此次交易可能爲雙方帶來更好的市場發展機遇，推動智能助手領域的發展。

2、微軟必應推出全新視頻創作工具Bing Video Creator，用戶可輕鬆生成 AI 視頻

微軟必應推出了基於OpenAI Sora模型的Bing視頻創作器，用戶可通過文本提示免費生成短視頻，但目前僅支持移動設備且生成速度較慢。

【AiBase提要:】
✨ 新功能:Bing視頻創作器首次免費開放，用戶只需簡單文字描述即可生成短視頻。
📱 限制:目前僅支持移動設備，未在桌面端推出，影響部分用戶的使用體驗。
💰 激勵機制:用戶可通過搜索或購物獲取積分，免費生成10段視頻後需付費繼續生成。

3、ElevenLabs推全新語音交互平臺Conversational AI2.0:AI語音助手比真人還懂你

ElevenLabs發佈了Conversational AI2.0，該平臺在對話流暢性、多語言支持和企業級應用能力上實現了重大突破，爲客服、營銷和內容創作等領域帶來全新可能。

【AiBase提要:】
引入先進輪流對話模型，精準捕捉用戶對話節奏，避免中斷，提升對話流暢性。
支持32+語言無縫切換，內置自動語言檢測功能，助力全球化企業客戶服務。
集成了RAG技術，從企業知識庫提取信息，確保回答專業性和準確性。
詳情鏈接:https://elevenlabs.io/blog/conversational-ai-2-0

4、谷歌 Gemini Live 功能正式登陸 iOS 平臺，開啓 AI 識別新體驗

谷歌的Gemini Live功能已上線iOS和iPadOS平臺，支持AI識別場景和屏幕內容，且目前免費使用。該功能通過攝像頭和屏幕共享提供便捷的信息獲取體驗，但目前僅限美國地區用戶使用。

【AiBase提要:】
✨Gemini Live現已支持iOS/iPadOS，利用AI快速識別物體並提供信息。
📱屏幕共享功能讓用戶能輕鬆分享屏幕內容，增強互動體驗。
🌍功能目前僅在美國可用，谷歌正推動AI技術更廣泛的應用。

5、Character.AI 推出新功能AvatarFX，用戶可製作個性化動畫視頻

Character.AI 推出了 AvatarFX 工具，允許用戶創建自定義動畫視頻，並新增了 '場景' 和 '流' 功能，同時面臨濫用問題。

【AiBase提要:】
🌟 Character.AI 推出 AvatarFX 工具，用戶可創建自定義動畫視頻。
🎬 新增的 '場景' 和 '流' 功能讓用戶能分享角色創作。
⚠️ Character.AI 因濫用事件受訴訟，平臺存在安全隱患。
詳情鏈接:https://blog.character.ai/character-ai-unveils-new-ways-to-create/

6、OpenAI用Rust重新打造Codex CLI，告別Node.js

OpenAI宣佈將其AI編程工具Codex CLI從Node.js遷移到Rust語言重寫，這一舉措帶來了性能優化、安全性提升及零依賴安裝等優勢。

【AiBase提要:】
🌟 Codex CLI由TypeScript和Node.js遷移到Rust，帶來性能優化與安全性提升。
🔒 Rust實現零依賴安裝，支持沙箱環境運行，增強跨平臺兼容性。
🚀 Rust語言特性助力Codex CLI成爲模型上下文協議客戶端和服務器，性能卓越。

7、NUS 推出 OmniConsistency:低成本實現圖像風格化一致性，挑戰 GPT-4o!

新加坡國立大學團隊發佈OmniConsistency項目，通過獨特學習框架和模塊化架構，在極低成本下實現圖像風格化與一致性的完美結合，爲開發者提供強大工具。

【AiBase提要:】
✨ 利用配對圖像數據學習風格遷移一致性，僅需2600對高質量圖像和500小時GPU算力即可達到驚豔效果。
🔄 支持模塊化架構，兼容現有風格化LoRA模塊，輕鬆整合進各類項目。
🌟 在開源生態中注入商業級能力，推動AI藝術創作發展。
詳情鏈接:https://github.com/showlab/OmniConsistency

8、Hume AI重磅發佈EVI3:懂你情緒的語音AI，比GPT-4o還快!

Hume AI發佈了第三代語音交互模型EVI3，具備卓越的情感理解能力和個性化交互體驗，標誌着語音AI在情感交互和自然溝通領域的重大突破。

【AiBase提要:】
✨ EVI3能精準識別用戶語音中的情緒並生成特定風格的聲音和個性，實現情感智能與語音交互的完美融合。
🚀 具備超低延遲與智能響應，推理延遲低至300毫秒，情感表達和自然度超越GPT-4o。
🌐 支持多場景應用，包括客戶服務、內容創作等，未來還將擴展多語言支持以覆蓋全球市場。
詳情鏈接:https://demo.hume.ai/

9、內幕曝光:蘋果擁有媲美ChatGPT的1500億參數AI模型卻拒絕發佈

蘋果將在WWDC上開放基礎模型，但性能有限，且其更強大的內部AI模型未有公開計劃。領導層分歧導致多項AI項目延期，WWDC更多是營銷包裝秀。

【AiBase提要:】
🍎 蘋果計劃開放的AI模型參數僅約30億，性能偏小且有限，主要支持基礎功能。
🚀 蘋果內部有更大規模的AI模型，最大達1500億參數，但僅用於內部測試，未有公開計劃。
⏳ 蘋果領導層分歧嚴重，多個AI項目延期，WWDC發佈的多爲小幅更新而非創新功能。

10、谷歌推出AI Edge Gallery應用，實現離線智能手機AI處理

谷歌推出了AI Edge Gallery應用，允許用戶在手機上離線運行復雜的AI模型，增強隱私保護，支持多種AI功能，但安裝和使用體驗仍有提升空間。

【AiBase提要:】
🌟 谷歌推出AI Edge Gallery應用，支持離線運行AI模型，增強隱私保護。
📱 應用支持Hugging Face模型下載，提供多輪對話、視覺問答等AI功能，所有處理在本地完成。
🔒 本地處理方式解決隱私問題，尤其適合醫療和金融等敏感行業。
詳情鏈接:https://github.com/google-ai-edge/gallery

11、Cerebras 推理 API 全面開放，開發者每日獲百萬免費 Token

Cerebras Systems宣佈其推理API全面開放，取消等待名單限制，並提供每日百萬免費Token，顯著提升AI推理效率，尤其在實時語音、視頻處理等領域表現卓越。

【AiBase提要:】
🚀 推理API開放且每日提供百萬免費Token，大幅降低開發者成本。
⚡ 推理速度達GPU的20倍，尤其適用於複雜推理模型及代碼生成任務。
🌐 支持主流開源模型，無縫嵌入Hugging Face和Meta平臺，簡化開發者流程。

12、英偉達與MIT合作推出 Fast-dLLM 框架，AI 推理速度提升27.6倍

英偉達聯合MIT與香港大學發佈Fast-dLLM框架，通過創新機制大幅提升擴散模型推理速度，同時保持生成質量，爲AI應用提供強大支持。

【AiBase提要:】
🌟 快速提升:通過塊狀近似KV緩存機制實現最高27.6倍推理速度提升。
🔍 創新技術:置信度感知並行解碼策略確保生成質量，減少依賴衝突。
📊 實測表現:多項基準測試顯示速度與準確率的良好平衡，推動擴散模型廣泛應用。
詳情鏈接:https://nvlabs.github.io/Fast-dLLM/