AI日報：抖音測試接入豆包AI；即夢接入DeepSeek支持智能提示詞生成；Grok語音模式全面開放

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、抖音打通豆包AI，字節跳動開啓超級AI生態戰略

抖音App正在測試接入豆包AI，標誌着字節跳動加速推進AI生態佈局。通過在短視頻界面和消息列表中開放入口，抖音旨在打破AI產品與流量平臺的壁壘，提升AI能力並引入更多用戶流量。字節內部還在推進多條AI產品業務線，展現出全方位的AI產品生態系統。

【AiBase提要:】
📱 抖音正在測試接入豆包AI，開放兩個戰略性入口，提升AI能力和用戶流量。
💡 字節跳動內部推進多條AI產品線，覆蓋多個領域，展現全方位的AI生態系統。
🏆 互聯網巨頭對AI技術在內容生態中的應用高度重視，開啓新的AI服務生態時代。

2、強強聯合!即夢接入DeepSeek 從提示詞到繪畫一步到位

即夢與DeepSeek的合作爲AI繪畫愛好者帶來了極大的便利。通過DeepSeek的智能提示詞生成功能，用戶不再需要爲創作靈感而煩惱，只需簡單輸入需求，便能獲得精準的提示詞，進而生成高質量的圖像。這一創新的聯動不僅提升了創作效率，還讓繪畫過程變得更加流暢和愉悅。

【AiBase提要:】
🖌️ 即夢接入DeepSeek，提供智能提示詞生成功能，解決用戶創作難題。
✨ 用戶只需輸入簡單需求，DeepSeek即可生成詳細精準的提示詞，提升創作效率。
🌟 DeepSeek生成的提示詞質量高，能夠有效引導AI生成高質量圖像，用戶反饋良好。

3、Grok 語音模式全面開放:11種模式上線，自帶字幕成英語學習利器

xAI公司的AI助手Grok正式向所有用戶開放其備受期待的語音模式，帶來了11種獨特的語音交互模式和語音字幕功能。這一更新不僅增強了用戶的互動體驗，還爲英語學習者提供了新的學習工具。用戶對這一更新反響熱烈，雖然目前僅支持英文，但Grok的多樣化表達和流暢度已獲得用戶的高度評價，未來擴展語言支持的期待也在不斷增加。

【AiBase提要:】
🎤 Grok的語音模式現已向所有用戶開放，提供11種獨特的交互風格，包括2種18+限制模式。
📚 新增的語音字幕功能幫助用戶更好地理解內容，成爲英語學習的實用工具。
🌍 用戶對Grok的流暢度和情感表達給予高度評價，期待未來能支持更多語言。

4、vivo重組調整，成立新AI部門並將大模型訓練轉向端側

vivo最近在其組織架構上進行了重要調整，成立了新的AI部門，顯示出其在人工智能領域的持續投入與戰略佈局。新部門將專注於大模型的端側訓練，並且暫停了對商業化的考覈，反映出vivo對AI技術長遠發展的重視。此外，vivo還推出了DeepSeek-R1，提升了AI助手的智能化水平，進一步推動了用戶體驗的提升。

【AiBase提要:】
🆕 vivo新設立AI部門，標誌着公司在人工智能技術上的持續投入和戰略佈局。
📉 由於管理干預，vivo決定暫時不對AI大模型的商業化進行考覈，並暫停資金投入。
🚀 最新推出的DeepSeek-R1提升了AI助手的智能化水平，用戶體驗得到了顯著改善。

5、全新技術 Fast3R :實現千張圖片一鍵3D 重建，速度驚人!

Fast3R是一種創新的多視角3D重建技術，能夠在一次前向傳播中處理多達1500張圖片，顯著提高重建速度。與傳統的DUSt3R方法相比，Fast3R利用基於Transformer的架構並行處理視圖信息，省去複雜的對齊過程，提升了推理速度並減少誤差積累。

【AiBase提要:】
🌟 Fast3R技術可以在一次前向傳播中處理多達1500張圖片，大幅提高3D重建速度。
⚡ Fast3R的Transformer架構支持並行處理，省去傳統方法的複雜對齊過程。
🚀 與DUSt3R相比，Fast3R在時間和內存使用上展現出顯著優勢，適用於大規模3D重建應用。
詳情鏈接:https://fast3r-3d.github.io/

6、音樂創作領域投下核彈!DiffRhythm 炸裂問世:10秒 AI 神曲，人聲伴奏一鍵搞定!

DiffRhythm的問世標誌着音樂創作的新時代，它通過擴散模型實現了端到端的自動生成音樂，用戶只需輸入歌詞和風格，即可在短短10秒內獲得一首完整的歌曲。DiffRhythm不僅能生成伴奏，還能自動創作歌詞，完美契合旋律，顛覆了傳統音樂創作的模式，開啓了AI音樂創作的新紀元。

【AiBase提要:】
🎤 DiffRhythm通過擴散模型實現端到端的音樂創作，用戶只需輸入歌詞和風格即可生成完整歌曲。
⚡ 生成速度極快，僅需10秒鐘便可完成一首4分45秒的歌曲，速度是傳統方法的50倍。
🎼 內置強大的大語言模型，能夠自動創作歌詞並與旋律完美匹配，徹底顛覆傳統作曲方式。
詳情鏈接:https://huggingface.co/spaces/ASLP-lab/DiffRhythm

7、微軟開源圖片模型ART，可生成多圖層透明圖片

在圖像生成領域，微軟研究人員推出的“Anonymous Region Transformer”（ART）技術，革新了用戶與生成模型的互動方式。通過匿名區域佈局，ART能夠根據全球文本提示直接生成多層透明圖像，並引入逐層區域裁剪機制，大幅提升生成效率，速度比傳統方法快12倍。

【AiBase提要:】
🌟 ART可根據全球文本提示和匿名區域佈局，直接生成多層透明圖像。
⚡️ 採用逐層區域裁剪機制，顯著提高了圖像生成效率，比傳統方法快12倍。
💡 新型高質量自編碼器支持多層透明圖像的精確控制與生成，推動交互式內容創作。
詳情鏈接:https://art-msra.github.io/

8、AI思維導圖神器 MindMapper :扔個鏈接就能生成交互式思維導圖

在信息爆炸的時代，Mind Mapper 應用程序成爲了思維整理的得力助手。它能夠將用戶的想法轉化爲生動的思維導圖，只需輸入網址、YouTube 視頻鏈接或文本提示，便能快速生成互動式思維導圖。

【AiBase提要:】
🖥️ Mind Mapper 能夠將想法轉化爲生動的思維導圖，支持網址、視頻鏈接和文本提示輸入。
🎨 採用 Mermaid.js 技術，思維導圖不僅美觀，還具備動態交互功能，用戶可輕鬆獲取詳細信息。
📤 提供將思維導圖下載爲 PNG 圖片的功能，方便用戶分享知識和靈感。
詳情鏈接:https://github.com/misbahsy/MindMapper

9、雷軍亮相首場代表通道:小米將把最新的AI技術應用到各個終端上

在全國人大十四屆三次會議的首場“代表通道”上，小米創辦人雷軍接受了記者提問，深入探討了小米在製造業中的角色及科技創新方向。他強調製造業是國家的基石，小米將加大研發投入，特別是在人工智能領域，以提升消費者的科技體驗，並助力中國式現代化。

【AiBase提要:】
🏭 製造業是國家立國之本，小米將堅定走科技創新和高端化發展道路。
💰 小米計劃在2021至2025年間投入1050億元用於研發，2025年預計投入300億元，AI相關業務佔四分之一。
🌍 小米致力於將最新的AI技術應用於手機、汽車和智能家居等領域，提升全球市場的影響力。

10、愛詩科技完成A5輪融資，劍指AI視頻生成領域新高地

愛詩科技近日宣佈完成A5輪融資，由靖亞資本獨家投資，融資額已超4億元，成爲AI視頻生成領域的明星企業。公司成立於2023年，由前字節跳動視覺技術負責人王長虎創立，團隊背景強大，迅速獲得多方投資者青睞。此次融資將用於加速研發和引進人才，致力於打造領先的AI視頻生成大模型及應用。

【AiBase提要:】
📈 愛詩科技完成A5輪融資，融資額已超4億元，成爲AI視頻生成領域的明星企業。
🌍 其產品PixVerse已擁有超過4000萬用戶，月活躍用戶達1500萬，技術實力領先。
💼 公司計劃加速模型研發與高端人才引進，積極拓展B端企業服務，面臨商業化挑戰。

AI日報：抖音測試接入豆包AI；即夢接入DeepSeek支持智能提示詞生成；Grok語音模式全面開放

相關推薦

餘承東：大模型戰場無第二，華爲盤古全面進階2.0

滴滴首批接入微信AI生態，核心網約車服務全面融入微信AI Agent

4月抖音新增AI短劇超4.4萬部達真人劇13倍，爆款破億率僅爲0.6%

AI“治安官”上崗週年：抖音大模型治理謠言，處置瀏覽量下降62%

阿里巴巴發佈生態級AI助手“千問小酒窩”，統一數字人形象全面接入阿里生態