歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、MiniMax海螺AI首尾幀功能在網頁版和APP雙端正式上線
海螺AI推出的首尾幀功能在網頁版和APP雙端正式上線,並開放僅尾幀玩法。該技術通過更強的指令理解、更絲滑的動態效果和更大膽的想象力,全面提升行業首尾幀能力的上限。
【AiBase提要:】
🧠 最強複雜指令遵循能力,精確理解和執行每一個細節
🎬 極限複雜物理動態生成,如打鬥、體操等高能動作的絲滑連招
🎨 超預期想象力功能,實現首尾幀跨度大或缺乏指令時的超綱發揮
2、元石科技發佈問小白5,挑戰 GPT-5,國產AI新標杆來襲
元石科技最新推出的旗艦產品問小白5在多項性能測試中接近GPT-5,標誌着國產大模型技術的重要突破。該系統具備動態思維模式,適用於多個領域,並在STEM能力、前沿知識和代碼編程等方面表現出色。
【AiBase提要:】
✨ 問小白5在多項性能測試中接近GPT-5,成爲國產AI的新標杆。
🧠 具備動態思維模式,智能判斷何時快速響應或深入思考。
📊 在STEM能力、前沿知識和代碼編程方面表現優異,綜合評分超越同類產品。
3、OpenAI 發佈全新語音模型 GPT-Realtime,專爲語音AI Agent設計
OpenAI 發佈了全新的語音模型 GPT-Realtime,該模型專爲語音 AI Agent 設計,能夠生成自然流暢的語音,並支持圖像輸入和多語言切換。其在推理能力和指令遵循準確率方面有顯著提升,同時提供了強大的安全防護功能,適用於多個行業領域。
【AiBase提要:】
🎙️ GPT-Realtime 是 OpenAI 發佈的多模態語音模型,專爲語音 AI Agent 設計。
🧠 該模型具備推理和指令遵循能力,提升了語音交互的智能化水平。
🔒 Realtime API 配備了安全防護措施,保障用戶隱私與數據安全。
4、告別繁瑣!谷歌Gemini AI讓表格處理變得輕鬆無比
谷歌引入Gemini AI助手,使Google Sheets的數據處理更加智能和高效,提升了用戶的使用體驗。
【AiBase提要:】
📊 谷歌Gemini AI助手爲Google Sheets帶來智能化的數據處理功能。
💡 新增的“轉換爲表格”功能能自動分析並整理數據,提升工作效率。
🔄 用戶可自定義公式表達式,適應數據變化,無需手動調整公式。
5、AI配音革命來了!騰訊黑科技讓機器秒變金牌說書人,一句話生成好萊塢級音效
文章介紹了騰訊ARC實驗室推出的AudioStory技術,該技術能夠根據文字描述生成高質量的音頻內容,具有強大的敘事能力。它通過分而治之策略和解耦式連接機制,實現了複雜的音頻生成任務。
【AiBase提要:】
✨ AudioStory技術能根據文字描述生成電影級音頻內容。
🧠 採用分而治之策略,將複雜故事拆解爲有序音頻事件。
🔄 解耦式連接機制確保了音頻質感與語義的精準匹配。
詳情鏈接:https://arxiv.org/pdf/2508.20088
6、百度未來五年計劃培養 1000 萬 AI 人才
文章介紹了百度在未來五年內計劃培養1000萬AI人才,同時展示了其在人工智能領域的持續投入和創新成果。此外,文章還提到百度的AI新業務收入表現亮眼,顯示出其在市場中的競爭力。
【AiBase提要:】
🌟 百度計劃在未來五年內再培養1000萬AI人才,推動行業發展。
📈 百度2025年第二季度財報顯示AI新業務收入突破100億元,同比增長34%。
🎓 人才培養將通過高校合作、企業培訓和在線教育等多種方式進行。
7、反作弊AI導師橫空出世!MathGPT.ai在美國30所高校試點成功,今秋將大規模推廣
MathGPT.ai通過蘇格拉底式教學法和教師主導的控制機制,重新定義了AI在數學教育中的角色。該平臺不僅提供反作弊導師服務,還支持大學水平的數學課程,並與主流學習管理系統集成,確保無障礙訪問。
【AiBase提要:】
🧠 MathGPT.ai採用蘇格拉底式提問技術,鼓勵學生批判性思考而非直接獲取答案。
🔒 教師可控制學生使用AI工具的方式,包括指定AI是否提供輔導支持。
🌐 平臺已與Canvas、Blackboard和Brightspace集成,併兼容屏幕閱讀器,提升無障礙訪問體驗。
8、蘋果Xcode重磅集成Claude Sonnet4:iOS開發迎來AI革命時代
蘋果在Xcode26Beta7中正式集成Claude Sonnet4AI模型,爲iOS開發者帶來智能編程體驗。該模型能夠生成高質量代碼、定位錯誤並自動修復,同時新增的inline playgrounds功能讓開發者可以直接在代碼行運行和測試代碼,提升開發效率。
【AiBase提要:】
🍎 集成Claude Sonnet4AI模型,提升代碼生成與錯誤修復能力。
🧪 新增inline playgrounds功能,支持實時運行代碼示例。
🔒 基於Apple官方擴展接口實現,確保功能穩定性和安全性。
9、微軟推首款自家研發AI模型MAI-Voice-1和MAI-1-preview,與OpenAI競爭
微軟推出了其首款自主研發的AI模型MAI-Voice-1和MAI-1-preview,這標誌着微軟在人工智能領域的重要進展,並增強了其與OpenAI的競爭實力。MAI-Voice-1能夠快速生成音頻,已被應用於Copilot Daily等功能;而MAI-1-preview則專注於日常查詢幫助,未來將用於Copilot AI助手的文本處理。
【AiBase提要:】
🗣️ MAI-Voice-1可以快速生成音頻,已應用於 Copilot Daily 等多個功能。
🚀 MAI-1-preview 將用於 Copilot AI 助手的文本處理,標誌着微軟在消費級 AI 領域的新進展。
🌟 微軟推出 MAI-Voice-1和 MAI-1-preview 兩款自家開發的 AI 模型,提升與 OpenAI 的競爭力。
詳情鏈接:https://microsoft.ai/news/two-new-in-house-models/
10、xAI隆重推出Grok Code Fast1:快速、經濟的高效代理編碼模型
xAI推出了Grok Code Fast1,這是一款專爲軟件開發設計的快速且經濟高效的大型語言模型。該模型在推理能力和代碼生成性能方面表現出色,並已在多個主流智能編程平臺上免費開放使用。
【AiBase提要:】
🚀 Grok Code Fast1採用了全新輕量化模型架構,提升了服務速度和緩存命中率。
🌐 支持GitHub Copilot、Cursor等多平臺,提供免費試用以吸引開發者體驗。
💰 定價策略具有競爭力,每百萬輸入令牌0.20美元,輸出令牌1.50美元,適合預算有限的開發者。
詳情鏈接:https://x.ai/news/grok-code-fast-1
11、SuperCLUE多模態視覺8月評測榜:Gemini-2.5-Pro位居第一
在8月28日發佈的中文多模態視覺語言模型測評基準(SuperCLUE-VLM)榜單中,Gemini-2.5-Pro以74.99分位列第一,OpenAI的GPT-5(high)以68.59分排名第二。該榜單圍繞基礎認知、視覺推理和視覺應用三大維度構建評測體系,旨在爲多模態視覺語言模型提供客觀、公正的評估標準。
【AiBase提要:】
🧠 Gemini-2.5-Pro在SuperCLUE-VLM榜單中以74.99分位居第一,展現強大的多模態能力。
📊 評測涵蓋15個多模態模型,包括Claude-Opus-4.1、GPT-5(high)等國內外主流模型。
🏆 百度ERNIE-4.5-Turbo-VL與其他國內模型並列,顯示出強勁的市場競爭力。
12、9月1日AI內容標識新規!不合規直接承擔法律風險,從業者速看避雷指南
文章詳細介紹了《人工智能生成合成內容標識方法》國家標準GB45438-2025的實施背景和核心要求。該標準對AI生成內容的標識方式、責任主體認定及違規後果進行了明確規定,強調了AI內容治理的重要性。
【AiBase提要:】
📌 顯式標識要求AI生成內容在文本、圖片、視頻等不同形式中明確標註AI屬性。
🔍 隱式標識通過文件元數據嵌入AIGC標識符,確保內容來源可追溯。
⚖️ 違規後果嚴重,包括限流、整改、下架以及法律風險,企業需立即進行合規準備。