歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、小米將多枚“Kimi” 商標轉讓給月之暗面

小米將“Kimi”商標轉讓給專注於AI助手的月之暗面,此舉可能是小米優化資源的戰略調整,同時助力月之暗面拓展其智能助手業務。

image.png

【AiBase提要:】

🌟 小米將多枚‘Kimi’商標轉讓給北京月之暗面科技有限公司,優化非核心商標資源。

🤖 月之暗面推出的Kimi智能助手於2023年上線,此次商標轉讓爲其發展提供支持。

🔍 此次交易可能爲雙方帶來更好的市場發展機遇,推動智能助手領域的發展。

2、微軟必應推出全新視頻創作工具Bing Video Creator,用戶可輕鬆生成 AI 視頻

微軟必應推出了基於OpenAI Sora模型的Bing視頻創作器,用戶可通過文本提示免費生成短視頻,但目前僅支持移動設備且生成速度較慢。

image.png

【AiBase提要:】

✨ 新功能:Bing視頻創作器首次免費開放,用戶只需簡單文字描述即可生成短視頻。

📱 限制:目前僅支持移動設備,未在桌面端推出,影響部分用戶的使用體驗。

💰 激勵機制:用戶可通過搜索或購物獲取積分,免費生成10段視頻後需付費繼續生成。

3、ElevenLabs推全新語音交互平臺Conversational AI2.0:AI語音助手比真人還懂你

ElevenLabs發佈了Conversational AI2.0,該平臺在對話流暢性、多語言支持和企業級應用能力上實現了重大突破,爲客服、營銷和內容創作等領域帶來全新可能。

【AiBase提要:】

引入先進輪流對話模型,精準捕捉用戶對話節奏,避免中斷,提升對話流暢性。

支持32+語言無縫切換,內置自動語言檢測功能,助力全球化企業客戶服務。

集成了RAG技術,從企業知識庫提取信息,確保回答專業性和準確性。

詳情鏈接:https://elevenlabs.io/blog/conversational-ai-2-0

4、谷歌 Gemini Live 功能正式登陸 iOS 平臺,開啓 AI 識別新體驗

谷歌的Gemini Live功能已上線iOS和iPadOS平臺,支持AI識別場景和屏幕內容,且目前免費使用。該功能通過攝像頭和屏幕共享提供便捷的信息獲取體驗,但目前僅限美國地區用戶使用。

【AiBase提要:】

✨Gemini Live現已支持iOS/iPadOS,利用AI快速識別物體並提供信息。

📱屏幕共享功能讓用戶能輕鬆分享屏幕內容,增強互動體驗。

🌍功能目前僅在美國可用,谷歌正推動AI技術更廣泛的應用。

5、Character.AI 推出新功能AvatarFX,用戶可製作個性化動畫視頻

Character.AI 推出了 AvatarFX 工具,允許用戶創建自定義動畫視頻,並新增了 '場景' 和 '流' 功能,同時面臨濫用問題。

【AiBase提要:】

🌟 Character.AI 推出 AvatarFX 工具,用戶可創建自定義動畫視頻。

🎬 新增的 '場景' 和 '流' 功能讓用戶能分享角色創作。

⚠️ Character.AI 因濫用事件受訴訟,平臺存在安全隱患。

詳情鏈接:https://blog.character.ai/character-ai-unveils-new-ways-to-create/

6、OpenAI用Rust重新打造Codex CLI,告別Node.js

OpenAI宣佈將其AI編程工具Codex CLI從Node.js遷移到Rust語言重寫,這一舉措帶來了性能優化、安全性提升及零依賴安裝等優勢。

【AiBase提要:】

🌟 Codex CLI由TypeScript和Node.js遷移到Rust,帶來性能優化與安全性提升。

🔒 Rust實現零依賴安裝,支持沙箱環境運行,增強跨平臺兼容性。

🚀 Rust語言特性助力Codex CLI成爲模型上下文協議客戶端和服務器,性能卓越。

7、NUS 推出 OmniConsistency:低成本實現圖像風格化一致性,挑戰 GPT-4o!

新加坡國立大學團隊發佈OmniConsistency項目,通過獨特學習框架和模塊化架構,在極低成本下實現圖像風格化與一致性的完美結合,爲開發者提供強大工具。

image.png

【AiBase提要:】

✨ 利用配對圖像數據學習風格遷移一致性,僅需2600對高質量圖像和500小時GPU算力即可達到驚豔效果。

🔄 支持模塊化架構,兼容現有風格化LoRA模塊,輕鬆整合進各類項目。

🌟 在開源生態中注入商業級能力,推動AI藝術創作發展。

詳情鏈接:https://github.com/showlab/OmniConsistency

8、Hume AI重磅發佈EVI3:懂你情緒的語音AI,比GPT-4o還快!

Hume AI發佈了第三代語音交互模型EVI3,具備卓越的情感理解能力和個性化交互體驗,標誌着語音AI在情感交互和自然溝通領域的重大突破。

【AiBase提要:】

✨ EVI3能精準識別用戶語音中的情緒並生成特定風格的聲音和個性,實現情感智能與語音交互的完美融合。

🚀 具備超低延遲與智能響應,推理延遲低至300毫秒,情感表達和自然度超越GPT-4o。

🌐 支持多場景應用,包括客戶服務、內容創作等,未來還將擴展多語言支持以覆蓋全球市場。

詳情鏈接:https://demo.hume.ai/

9、內幕曝光:蘋果擁有媲美ChatGPT的1500億參數AI模型卻拒絕發佈

蘋果將在WWDC上開放基礎模型,但性能有限,且其更強大的內部AI模型未有公開計劃。領導層分歧導致多項AI項目延期,WWDC更多是營銷包裝秀。

【AiBase提要:】

🍎 蘋果計劃開放的AI模型參數僅約30億,性能偏小且有限,主要支持基礎功能。

🚀 蘋果內部有更大規模的AI模型,最大達1500億參數,但僅用於內部測試,未有公開計劃。

⏳ 蘋果領導層分歧嚴重,多個AI項目延期,WWDC發佈的多爲小幅更新而非創新功能。

10、谷歌推出AI Edge Gallery應用,實現離線智能手機AI處理

谷歌推出了AI Edge Gallery應用,允許用戶在手機上離線運行復雜的AI模型,增強隱私保護,支持多種AI功能,但安裝和使用體驗仍有提升空間。

image.png

【AiBase提要:】

🌟 谷歌推出AI Edge Gallery應用,支持離線運行AI模型,增強隱私保護。

📱 應用支持Hugging Face模型下載,提供多輪對話、視覺問答等AI功能,所有處理在本地完成。

🔒 本地處理方式解決隱私問題,尤其適合醫療和金融等敏感行業。

詳情鏈接:https://github.com/google-ai-edge/gallery

11、Cerebras 推理 API 全面開放,開發者每日獲百萬免費 Token

Cerebras Systems宣佈其推理API全面開放,取消等待名單限制,並提供每日百萬免費Token,顯著提升AI推理效率,尤其在實時語音、視頻處理等領域表現卓越。

image.png

【AiBase提要:】

🚀 推理API開放且每日提供百萬免費Token,大幅降低開發者成本。

⚡ 推理速度達GPU的20倍,尤其適用於複雜推理模型及代碼生成任務。

🌐 支持主流開源模型,無縫嵌入Hugging Face和Meta平臺,簡化開發者流程。

12、英偉達與MIT合作推出 Fast-dLLM 框架,AI 推理速度提升27.6倍

英偉達聯合MIT與香港大學發佈Fast-dLLM框架,通過創新機制大幅提升擴散模型推理速度,同時保持生成質量,爲AI應用提供強大支持。

image.png

【AiBase提要:】

🌟 快速提升:通過塊狀近似KV緩存機制實現最高27.6倍推理速度提升。

🔍 創新技術:置信度感知並行解碼策略確保生成質量,減少依賴衝突。

📊 實測表現:多項基準測試顯示速度與準確率的良好平衡,推動擴散模型廣泛應用。

詳情鏈接:https://nvlabs.github.io/Fast-dLLM/