歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、騰訊元寶推出新功能:一句話或一張圖即可生成視頻!

騰訊元寶推出了一個創新功能,允許用戶通過一句話或一張圖片生成視頻,基於騰訊混元團隊最新開源的HunyuanVideo1.5模型。該模型採用Diffusion Transformer(DiT)架構,擁有8.3億個參數,支持生成5至10秒的高清視頻。這一功能不僅爲普通用戶提供了便捷的創作工具,也爲內容創作者帶來了新的靈感來源,進一步增強了社交媒體內容的豐富性。

image.png

【AiBase提要:】

🎥 騰訊元寶推出新功能,讓用戶通過一句話或一張圖生成視頻。

🚀 HunyuanVideo1.5模型支持生成5至10秒的高清視頻,使用簡單。

💡 新功能爲用戶提供了更多創作靈感,助力內容豐富化。

2、谷歌推出Nano Banana Pro:基於Gemini 3,支持4K、聯網搜索與C2PA驗證

谷歌推出Nano Banana Pro,基於Gemini 3模型,支持4K分辨率、14對象融合、5人身份一致性保持,並新增聯網搜索與C2PA驗證功能。定價上調,功能亮點包括專業控制、聯網生成和雙重水印,開發者可通過多種方式接入。

image.png

【AiBase提要:】

📷 專業控制:用戶可在提示詞中指定機位、景深、焦點、光效與色彩分級,默認提供6張高保真成片供挑選。

🌐 聯網生成:模型可實時搜索網絡,自動抓取食譜、資訊或股價並生成對應信息圖,已在NotebookLM、Flow、Slides與Vids中集成。

🔒 雙重水印:SynthID隱形水印+C2PA內容憑證同時寫入,用戶上傳圖片即可在Gemini App驗證是否由谷歌模型生成或修改。

3、夸克AI眼鏡與高德合作加碼,陸續接入掃街榜、打車等出行服務

夸克AI眼鏡與高德深化合作,推出多項新功能,如導航投屏、方向指引隨頭轉動等,提升用戶出行體驗。

image.png

【AiBase提要:】

🚀 夸克AI眼鏡新增導航投屏功能,實現手機與眼鏡無縫連接。

🧭 導航方向隨頭部轉動調整,提升步行和騎行時的便捷性與安全性。

🍽️ 支持周邊搜索及打車行程提醒,優化城市探索體驗。

4、豆包輸入法低調現身小米商店,主打智能語音交互

豆包輸入法作爲豆包生態的新成員,搭載了與豆包App同源的語音輸入技術,支持多種語言和輸入方式,同時具備智能聯想功能,旨在提升用戶的輸入效率。

【AiBase提要:】

🎙️ 支持多種方言、純英文及中英混合輸入,優化了“輕聲說話”功能。

⌨️ 提供經典9鍵與26鍵佈局,並內置剪貼板、常用語及即時翻譯等實用工具。

🧠 智能聯想功能覆蓋文字、標點符號、Emoji、數學公式及日期等多個維度,提升輸入效率。

5、月之暗面計劃明年下半年上市,估值或達 40 億美元

月之暗面計劃於明年下半年進行首次公開募股(IPO),融資完成後公司估值可能達到約40億美元。該項目致力於探索月球資源及其在地球的應用,吸引了衆多科技愛好者和投資者的關注。

【AiBase提要:】

🌕 月之暗面計劃於明年下半年進行首次公開募股(IPO)

💰 融資完成後,公司估值可能達到約40億美元

🚀 月之暗面致力於探索月球資源及其在地球的應用

6、MOSS-Speech開源:國內首個語音到語音大模型,告別文本中介

MOSS-Speech是復旦大學MOSS團隊推出的國內首個端到端語音到語音對話模型,無需依賴ASR→LLM→TTS流水線,具備語音問答、情緒模仿與笑聲生成能力。其在多項評測中表現優異,且已開源代碼和權重,支持商用許可。

image.png

【AiBase提要:】

🚀 MOSS-Speech實現端到端語音到語音對話,無需文本中介。

📊 在ZeroSpeech2025任務中WER降至4.1%,情感識別準確率91.2%。

📦 提供48kHz超採樣版與16kHz輕量版,支持實時推理與本地私有聲音克隆。

7、ChatGPT 羣聊功能正式上線:最多可容納 20 人,AI 參與頭腦風暴

ChatGPT 的羣聊功能正式上線,支持最多20人同時在線,並允許 AI 參與討論。用戶可以通過生成分享鏈接邀請他人加入,增強了團隊協作能力。同時,OpenAI 強調了隱私保護,確保羣聊創建者的個人數據不會被共享。

image.png

【AiBase提要:】

🤖 ChatGPT 羣聊功能現已全面上線,支持最多20人同時參與。

🌟 用戶可通過分享鏈接輕鬆邀請他人加入羣聊,增強團隊協作。

🔒 羣聊創建者的個人數據安全得到了保護,AI 可以在對話中靈活參與。

8、谷歌NotebookLM重磅更新:AI一鍵生成專業PPT,配圖驚豔碾壓Gemini App!

谷歌NotebookLM的升級版引入了Slide Decks功能,能夠將用戶上傳的資料轉化爲專業級演示文稿,同時配圖由Nano Banana Pro模型驅動,確保視覺效果高質量。此外,支持自定義提示詞,提升用戶體驗。

image.png

【AiBase提要:】

🖼️ 新增Slide Decks功能,可將資料一鍵生成專業PPT。

🎨 配圖由Nano Banana Pro模型驅動,視覺效果驚豔。

⚙️ 支持自定義提示詞,實現深度定製化生成。