歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、可靈AI發佈數字人新功能:一張圖片生成 1 分鐘高清視頻
可靈AI推出的數字人功能實現了從靜態圖片到動態視頻的突破,用戶只需提供角色圖片和文字或音頻輸入,即可快速生成高質量視頻。該技術基於多模態理解和視頻生成模型,支持多種角色創建和多語種處理,爲內容創作、教育培訓和企業宣傳提供了新的可能性。

【AiBase提要:】
📷 可靈AI推出數字人功能,實現靜態圖片到動態視頻的轉變。
🎙️ 支持多語種處理,涵蓋中文、英語、日語、韓語等語言。
💡 降低視頻製作門檻,讓普通用戶也能輕鬆創建專業水準的數字人視頻。
詳情鏈接:https://klingavatar.github.io/
2、騰訊混元新技術給大模型 “去油”,讓AI生成圖像更真實!
騰訊混元團隊與香港中文大學(深圳)及清華大學合作,推出了SRPO技術,旨在提升AI生成圖像的真實感,解決Flux模型在人物皮膚質感上的問題。該技術引入了“語義相對偏好優化”策略,並採用Direct-Align策略優化生成軌跡,顯著提升了圖像質量與訓練效率。

【AiBase提要:】
🧪 引入“語義相對偏好優化”策略,通過正向和負向詞彙引導信號以中和獎勵模型的偏差。
📈 採用Direct-Align策略,注入可控噪聲並利用其作爲參考錨點進行圖像重建,顯著降低重建誤差。
⚡ SRPO技術訓練效率極高,僅需10分鐘便能超越現有方法,真實度和美學評分提升超過三倍。
詳情鏈接:https://tencent.github.io/srpo-project-page/
3、IBM 發佈 Granite-Docling-258M:開源企業級文檔 AI 模型
IBM 推出的 Granite-Docling-258M 是一個開源的視覺語言模型,專注於端到端文檔轉換。它能夠保持文檔的佈局信息,提取表格、代碼、公式等元素,並輸出結構化的機器可讀格式,相較於傳統 OCR 技術有顯著提升。
【AiBase提要:】
🌟 新模型 Granite-Docling-258M 旨在提高文檔轉換精度,並保持佈局信息。
🔧 採用先進的技術架構,相較於前版本 SmolDocling 在多個領域表現出色。
🌍 新增對多種語言的支持,增強了模型的應用範圍和靈活性。
詳情鏈接:https://huggingface.co/collections/ibm-granite/granite-docling-682b8c766a565487bcb3ca00
4、Meta發佈首款帶屏幕AI眼鏡Ray-Ban :隨身佩戴的智能助理
Meta 推出首款帶屏幕的 AI 眼鏡 Ray-Ban,旨在提供更便捷的智能體驗,並與神經腕帶結合實現精準操控,進一步減少對移動設備的依賴。

【AiBase提要:】
📱 右側鏡片內置顯示屏,可呈現應用程序、提醒和導航信息。
🧠 與神經腕帶搭配使用,通過肌電圖技術實現精準操控。
🌐 支持連接雲端,可在眼鏡上使用 Meta 旗下應用及查看路線和實時翻譯。
5、DeepSeek 論文登上 Nature 封面,AI 大模型首次通過同行評審
DeepSeek R1的研究論文成功登上《Nature》封面,標誌着大語言模型首次通過權威同行評審,爲AI行業樹立了新的學術標準。該模型通過強化學習實現自主演化,提升了推理能力,並在數學競賽中表現出色。
【AiBase提要:】
🧠 DeepSeek R1通過強化學習在自主環境中自我演化,發展出複雜的推理能力。
📊 在AIME2024數學競賽中,DeepSeek-R1的表現從15.6%躍升至71.0%,達到與OpenAI模型相當的水平。
🛠️ DeepSeek團隊採用了結合拒絕採樣和監督微調的多階段訓練框架,提升模型寫作能力和整體表現。
6、OpenAI宣佈ChatGPT 網頁端新增 GPT-5 Thinking 調整功能
OpenAI推出了全新的‘Thinking 調整功能’,允許用戶根據需求選擇GPT-5模型的思考時長,從而平衡回覆速度與智能程度。此外,OpenAI還在積極開發兒童版ChatGPT,以確保未成年人使用安全。

【AiBase提要:】
🌟 新功能上線:ChatGPT網頁端推出可調節思考時長的功能,提升用戶體驗。
🛠️ 多種模式選擇:用戶可以選擇標準、擴展、輕量或重度模式,以滿足不同的交流需求。
👶 兒童版開發:OpenAI正在研發兒童版ChatGPT,確保未成年人在使用中的安全。
7、抖音上線 “AI求真” 功能,助你辨別謠言,尋找真相!
抖音推出“AI求真”功能,旨在幫助用戶辨別謠言並尋找真相,提升信息透明度和用戶保護能力。
【AiBase提要:】
🧠 AI 抖音求真功能上線,幫助用戶識別和澄清誤導性信息。
🔍 用戶可點擊鏈接跳轉至“求真卡”頁面獲取完整信息。
📢 平臺通過謠言治理大模型和闢謠團隊提升信息透明度。
8、通義DeepResearch發佈!全開源AI模型讓研究更簡單
通義 DeepResearch 團隊發佈的全開源AI模型在多個權威基準測試中表現出色,其性能甚至超過了許多國際知名模型,同時通過開放的方式推動了AI研究的發展。

【AiBase提要:】
🧠 通義 DeepResearch 團隊發佈了全開源AI模型,使AI從“能聊天”躍升至“會做研究”。
🚀 在多個權威基準測試中取得先進成績,模型性能超越許多國際知名模型。
🌐 模型、框架及方案完全開源,爲全球科技社區提供開放合作的範例。
