歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://top.aibase.com/

1、字節跳動發佈端到端同聲傳譯模型 Seed LiveInterpret 2.0

字節跳動Seed團隊推出了最新研發成果——Seed LiveInterpret 2.0,該模型在中英同傳翻譯質量上達到業界頂尖水平,具備低延遲和實時聲音復刻功能,顯著提升了跨語言交流的自然度和流暢性。

image.png

【AiBase提要:】

🚀 Seed LiveInterpret 2.0實現了接近真人同傳的翻譯準確率,且延遲極低,僅需3秒。

🎙️ 支持實時聲音復刻功能,無需提前採集聲音樣本即可合成“原聲”語音翻譯。

📊 在專業評測中,Seed LiveInterpret 2.0在中英互譯任務中表現優異,評分遠超其他系統。

詳情鏈接:https://arxiv.org/pdf/2507.17527

2、祕塔搜索 API 上線:定價3分錢 提供多模態搜索能力

祕塔 AI 搜索正式推出其搜索 API,爲開發者提供了一個替代 Bing Search API 的新選擇。該 API 定價0.03元/查詢,支持多模態搜索,並且無使用門檻,便於快速接入。


image.png

【AiBase提要:】

✅ 祕塔 AI 搜索 API 正式上線,爲開發者提供新的搜索替代方案。

💡 定價0.03元/查詢,具有市場競爭力,支持多模態搜索。

🚀 開發者可即測即用,無需複雜申請流程,提升接入效率。

3、Lovart AI 正式版全球發佈:全鏈路智能設計重塑創作體驗

文章介紹了 Lovart AI 正式版的全球發佈,強調其作爲首個人工智能設計 Agent 的創新性,以及其通過自然語言交互和全鏈路設計能力重新定義設計行業標準。文章還提到其新功能 ChatCanvas 和針對中國市場的“星流 Agent”,並指出其對設計行業的深遠影響。


image.png

【AiBase提要:】

🎨 Lovart AI 通過自然語言交互和全鏈路設計能力,提供高質量視覺資產生成服務。

🧠 新功能 ChatCanvas 支持多輪對話和實時調整佈局、配色等,提升創作效率。

🇨🇳 針對中國市場優化的“星流 Agent”支持中文語義和國風審美,助力本土創作者高效創作。

4、李沐團隊發佈 Higgs Audio v2,開創語音合成新紀元

李沐團隊推出的Higgs Audio v2是語音合成領域的一次重大突破,具備多語言對話生成、韻律自動調整和聲音克隆等功能。該模型融合了1000萬小時的語音數據進行訓練,在多項測試中表現出色,成爲行業標杆。


image.png

【AiBase提要:】

🔥 Higgs Audio v2支持多語言對話生成與聲音克隆,實現複雜任務。

📊 在EmergentTTS-Eval測試中,Higgs Audio v2在情緒和問題類別中表現優異。

🚀 支持實時語音聊天和音頻內容創作,適用於虛擬主播和語音助手等場景。

5、Sora2浮出水面:OpenAI 欲在生成式AI視頻領域重奪C位

文章介紹了OpenAI正在開發其文本到視頻模型Sora的繼任者Sora2,同時提到谷歌Veo3的普及情況。這表明生成式AI視頻領域的競爭將更加激烈。


image.png

【AiBase提要:】

🚀 OpenAI正在積極開發Sora2,以應對谷歌Veo3的競爭。

💡 Sora2尚未公開發布,但未來幾周內可能有更多消息。

🌐 谷歌Veo3已向大學生免費開放,並可通過Google Cloud體驗。

6、OpenAI與Oracle攜手擴展Stargate項目,已創造數千個工作崗位

OpenAI與Oracle達成新協議,將Stargate項目在美國的數據中心容量擴大至4.5吉瓦,整體容量超過5吉瓦。這標誌着OpenAI在2029年前實現10吉瓦目標的重要一步。該項目旨在推動美國成爲全球人工智能發展的主導力量,並吸引了多家科技公司和國際投資者的參與。

【AiBase提要:】

🔥 Stargate項目容量擴大至超過5吉瓦,目標是到2029年實現10吉瓦。

🤝 OpenAI與Oracle等多家科技公司聯合推動項目,預計將創造超10萬個工作崗位。

💰 項目獲得了超過190億美元的資金支持,吸引了多國投資者參與。

7、Google Photos新增AI功能:照片秒變動漫、一鍵生成視頻

Google Photos推出了多項基於AI的新功能,包括將靜態照片轉化爲動態視頻以及將照片轉換爲不同藝術風格的創意工具。這些功能旨在提升用戶的創作體驗,並通過實驗性方式不斷優化產品。


image.png

【AiBase提要:】

📷 照片轉視頻功能利用Veo2模型,讓用戶輕鬆將靜態照片變成6秒動態視頻。

🎨 Remix功能由Imagen AI驅動,可將普通照片轉換成動漫、漫畫等藝術風格。

📌 Google在Photos應用中新增了‘創建’標籤頁,整合多種創意工具,提供一站式創作體驗。

8、YouTube Shorts將推全新AI特效 照片秒變視頻!

YouTube宣佈爲Shorts創作者開放一系列革命性的生成式AI功能,包括圖片轉視頻和AI特效。這些工具能夠將靜態照片轉化爲動態視頻,並提供多種創意選項,顯著降低了創作門檻,同時提升了內容的吸引力。

【AiBase提要:】

📷 圖片轉視頻功能讓靜態照片在6秒內獲得生命力,提升短視頻創作效率。

🎨 AI特效可將塗鴉、自拍等簡單素材轉化爲精美藝術作品,激發創作者靈感。

🎥 新一代Veo3視頻生成器將同步生成音頻,提供更完整的創作解決方案。

9、谷歌推出 Aeneas 模型:爲古代文本解讀開闢新路徑

谷歌推出的 Aeneas 模型爲古代銘文的解讀提供了全新的方法,通過人工智能技術加速了歷史學家對銘文的恢復、鑑定和年代定位工作,同時還能擴展到其他古代語言和材料,極大地提升了歷史研究的效率和深度。


image.png

【AiBase提要:】

🧠 Aeneas 模型由谷歌 DeepMind 推出,旨在幫助歷史學家理解古代文本。

🗣️ 該模型能夠分析古代文本的相似性,填補文本空白,減輕歷史研究者的負擔。

📜 Aeneas 將文本轉化爲 “歷史指紋”,幫助歷史學家在更廣泛的背景下解讀銘文。

詳情鏈接:https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

10、GitHub Spark橫空出世:一句話打造Web應用,AI開發進入新時代!

GitHub Spark通過自然語言處理技術,讓開發者和非開發者都能快速構建個性化Web應用,顯著降低了編程門檻,併爲微應用開發提供了全新可能。

【AiBase提要:】

🌟 GitHub Spark允許用戶通過自然語言描述需求,快速生成完整的Web應用。

🚀 提供全託管運行環境,支持一鍵部署和PWA適配,簡化了開發流程。

🔧 支持多模型選擇,與GitHub生態深度整合,提升開發效率。

詳情鏈接:https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-cop ilot-pro-subscribers/

11、華爲M-Pencil Pro發佈:699元 支持一鍵喚起小藝智能助手

華爲發佈了全新一代手寫筆HUAWEI M-Pencil Pro,定價699元,具備16384級壓感、側旋功能和多種筆尖選擇,同時支持AI功能快捷入口和星閃精確查找功能,爲創作者帶來更便捷和真實的創作體驗。

image.png

【AiBase提要:】

✨ HUAWEI M-Pencil Pro擁有16384級壓感,精準感應力度變化,提升創作真實感。

💡 筆尾智慧鍵採用鴻蒙星環設計的呼吸燈,可一鍵喚起小藝智能助手,提升操作便捷性。

📍 星閃精確查找功能支持50米範圍內的精確定位,解決手寫筆丟失問題。