歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、騰訊混元推出5個開源3D模型:30秒生成,兼容多平臺

騰訊混元宣佈推出五個全新開源3D生成模型,基於Hunyuan3D-2.0,具備更快的生成速度和更豐富的細節。Turbo系列模型利用FlashVDM框架實現生成加速,縮短至30秒內完成。升級後的3D AI創作引擎支持多視圖輸入,用戶可通過上傳少量圖片快速生成高質量3D模型,降低製作成本。新模型廣泛應用於UGC、商品素材合成和遊戲資產生成,滿足遊戲3D資產標準。

image.png

【AiBase提要:】

⚡ Turbo系列模型通過FlashVDM框架實現數十倍加速,生成時間縮短至30秒。

🖼️ Hunyuan3D-2-MV模型能更好地捕捉細節,生成符合用戶預期的3D資產。

🛠️ 升級後的引擎支持多視圖輸入,用戶只需上傳2-4張圖片即可快速生成高質量3D模型。

2、Anthropic發佈MCP傳輸機制重大升級:告別長連接,迎接更靈活的Streamable HTTP

Anthropic對Model Context Protocol(MCP)進行了重大更新,推出了Streamable HTTP傳輸方式,取代了傳統的HTTP+SSE方案。這一創新解決了MCP遠程傳輸的關鍵限制,提升了靈活性和兼容性。新機制允許客戶端與服務器之間更高效的雙向通信,支持無狀態服務器運行,簡化了部署流程,並提高了系統的可擴展性。

【AiBase提要:】

🚀 移除專用的/sse端點,所有消息通過統一的/message端點傳輸,簡化了通信流程。

🔄 服務器可動態將HTTP請求升級爲SSE流,支持靈活的雙向通信,解決了SSE的單向限制。

🌐 新方案兼容性大幅提升,適用於各種網絡基礎設施,支持無狀態模式,降低了資源消耗。

詳情鏈接:https://github.com/modelcontextprotocol/specification/pull/206

3、生數科技Vidu將打造首部海外AI原創科幻動漫劇集

生數科技有限公司與Aura Productions達成戰略合作,計劃推出首部海外AI原創科幻動漫劇集。這一合作標誌着AI技術在動漫製作中的應用,開啓了動漫行業新的篇章。雙方將共同製作50集短篇科幻動漫系列,利用Vidu的先進視頻生成技術,提升製作效率和質量,預示着未來動漫創作將更加智能化和高效化。

image.png

【AiBase提要:】

🚀 合作推出50集短篇科幻動漫系列,計劃在全球主流社交媒體平臺發佈。

🤖 Vidu的多主體一致性功能確保角色與場景的無縫融合,實現高質量動畫敘事。

⏱️ Vidu2.0版本大幅提升視頻生成效率,能在10秒內快速生成高質量視頻。

4、谷歌雲重磅推出高清語音模型 Chirp3,支持248種聲音

谷歌雲在倫敦的DeepMind總部推出了高清語音模型Chirp3,旨在爲開發者提供強大的語音合成工具。該模型支持248種不同的聲音和31種語言,能夠幫助開發者創建智能語音助手、有聲讀物和視頻配音等應用。爲了確保負責任的使用,谷歌限制了語音克隆功能的訪問權限,並重申了對數據隱私的承諾。

image.png

【AiBase提要:】

🌟 谷歌雲推出Chirp3語音模型,支持248種聲音和31種語言,助力開發者構建智能應用。

🔒 谷歌限制語音克隆功能的訪問權限,以確保倫理AI的實踐和防止濫用。

💼 谷歌發起計劃提升英國AI技能,並向初創企業提供雲基礎設施支持,促進創新。

詳情鏈接:https://cloud.google.com/text-to-speech/docs/chirp3-hd

5、馬斯克xAI收購視頻生成初創公司Hotshot,AI視頻領域競爭再升級

埃隆·馬斯克旗下的xAI公司收購了視頻生成AI初創公司Hotshot,標誌着其在多模態AI技術領域的進一步擴展。Hotshot以其獨特的技術優勢和強大的算力支持,致力於提升視頻生成能力。

【AiBase提要:】

🤖 Hotshot專注於AI視頻生成,利用600萬個視頻片段進行訓練,提升了模型理解視頻內容的能力。

⚙️ 收購後,Hotshot將繼續擴大視頻生成器的開發,利用xAI的Colossus超級計算機的強大算力。

💼 此次收購標誌着馬斯克在AI技術領域的進一步佈局,預示着AI視頻生成技術將迎來新一輪的突破。

6、Roblox開源Cube3D:首個基礎AI模型實現3D對象生成

Roblox近日推出並開源了Cube3D,這是其首個用於生成3D對象的基礎AI模型,旨在提升3D創作效率。該模型通過創新的訓練方法,將3D對象標記化,能夠快速生成完整的3D形狀。未來,Cube3D將發展爲一個多模態模型,支持多種輸入類型,包括文本、圖像和視頻,進一步增強與Roblox現有AI創作工具的整合。

image.png

【AiBase提要:】

🛠️ Cube3D是Roblox首個開源的3D對象生成AI模型,旨在提高開發者的創作效率。

🔍 該模型通過創新的訓練方法,能夠將3D對象標記化並預測下一個形狀,快速構建完整的3D對象。

🌐 Roblox計劃將Cube3D發展爲多模態模型,未來將支持文本、圖像和視頻輸入,增強創作工具的功能。

7、Zoom AI助手AI Companion功能升級

Zoom公司最近宣佈了其AI助手Zoom AI Companion的新一輪功能升級,標誌着這一工具的演變,旨在提升用戶在視頻會議中的互動體驗和工作效率。新功能包括自動識別和完成待辦事項的Zoom Tasks、轉錄線下對話的新語音錄音器、以及定製AI助手等,預計將顯著增強用戶的生產力和協作能力。

image.png

【AiBase提要:】

🌟 Zoom Tasks功能可以自動識別會議中的待辦事項並完成相關任務。

🗣️ 新語音錄音器能夠轉錄線下對話並提供實時會議筆記。

📅 定製AI助手功能將於4月推出,用戶可根據需求定製功能。

8、128K超長記憶!Mistral最新開源模型Mistral Small3.1登場,參數方面優於 GPT-4o Mini

Mistral AI發佈了開源模型Mistral Small3.1,憑藉240億參數的設計,其性能可與谷歌和OpenAI的產品相媲美。該模型在文本處理和多模態理解上有顯著提升,支持128k tokens的上下文窗口,處理速度達到每秒150個tokens。

image.png

【AiBase提要:】

🌟 Mistral Small3.1具備240億參數,性能媲美谷歌和OpenAI的同類產品,推動AI市場競爭。

📈 該模型支持128k tokens的上下文窗口,處理速度高達每秒150個tokens,適用於長文檔和快速響應場景。

🌍 Mistral採取開源策略,發佈Apache2.0許可證,強調歐洲數字主權,吸引全球開發者參與創新。

詳情鏈接:https://top.aibase.com/tool/mistral-small-3-1

9、誰說視頻只能“一鏡到底”?字節創新技術LCT,讓AI像導演一樣拍攝電影大片!

長上下文調整(LCT)技術的出現,極大提升了AI生成視頻的敘事能力,使其能夠像電影導演一樣自由切換鏡頭,構建更連貫的故事場景。通過引入全注意力機制、交錯的3D位置嵌入和異步噪聲策略,LCT解決了多鏡頭生成中的視覺一致性和時間動態問題。

【AiBase提要:】

🎥 LCT技術使AI視頻生成模型能夠執導多鏡頭敘事視頻,提升敘事能力。

🔍 通過全注意力機制和交錯的3D位置嵌入,LCT確保視覺一致性和時間動態。

🚀 LCT支持自迴歸鏡頭擴展,便於長視頻創作和交互式修改。

詳情鏈接:https://top.aibase.com/tool/zhangshangxiawentiaoyoulct

10、32B參數的“逆襲”!OLMo232B橫空出世,叫板GPT-3.5Turbo

OLMo232B是艾倫人工智能研究所發佈的最新大型語言模型,憑藉320億參數和完全開源的特性,挑戰了許多專有模型。通過精細的訓練過程,OLMo232B在多項基準測試中超越了GPT-3.5Turbo和GPT-4o mini,展現出卓越的性能和更高的訓練效率。

image.png

【AiBase提要:】

🌐 OLMo232B是完全開源的語言模型,公開了所有數據、代碼和訓練過程,促進全球研究合作。

📈 該模型擁有320億參數,在多項基準測試中超越了GPT-3.5Turbo,證明了開源模型的強大實力。

⚡ OLMo232B在訓練效率上表現優異,僅使用三分之一的計算資源,展現出高效的AI開發潛力。

詳情鏈接:https://github.com/allenai/OLMo-core