AI日報：可靈AI發佈數字人新功能；騰訊混元新技術給大模型 “去油”；抖音上線AI求真功能

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://app.aibase.com/zh

1、可靈AI發佈數字人新功能：一張圖片生成 1 分鐘高清視頻

可靈AI推出的數字人功能實現了從靜態圖片到動態視頻的突破，用戶只需提供角色圖片和文字或音頻輸入，即可快速生成高質量視頻。該技術基於多模態理解和視頻生成模型，支持多種角色創建和多語種處理，爲內容創作、教育培訓和企業宣傳提供了新的可能性。

【AiBase提要:】
📷 可靈AI推出數字人功能，實現靜態圖片到動態視頻的轉變。
🎙️ 支持多語種處理，涵蓋中文、英語、日語、韓語等語言。
💡 降低視頻製作門檻，讓普通用戶也能輕鬆創建專業水準的數字人視頻。
詳情鏈接:https://klingavatar.github.io/

2、騰訊混元新技術給大模型 “去油”，讓AI生成圖像更真實！

騰訊混元團隊與香港中文大學（深圳）及清華大學合作，推出了SRPO技術，旨在提升AI生成圖像的真實感，解決Flux模型在人物皮膚質感上的問題。該技術引入了“語義相對偏好優化”策略，並採用Direct-Align策略優化生成軌跡，顯著提升了圖像質量與訓練效率。

【AiBase提要:】
🧪 引入“語義相對偏好優化”策略，通過正向和負向詞彙引導信號以中和獎勵模型的偏差。
📈 採用Direct-Align策略，注入可控噪聲並利用其作爲參考錨點進行圖像重建，顯著降低重建誤差。
⚡ SRPO技術訓練效率極高，僅需10分鐘便能超越現有方法，真實度和美學評分提升超過三倍。
詳情鏈接:https://tencent.github.io/srpo-project-page/

3、IBM 發佈 Granite-Docling-258M:開源企業級文檔 AI 模型

IBM 推出的 Granite-Docling-258M 是一個開源的視覺語言模型，專注於端到端文檔轉換。它能夠保持文檔的佈局信息，提取表格、代碼、公式等元素，並輸出結構化的機器可讀格式，相較於傳統 OCR 技術有顯著提升。

【AiBase提要:】
🌟 新模型 Granite-Docling-258M 旨在提高文檔轉換精度，並保持佈局信息。
🔧 採用先進的技術架構，相較於前版本 SmolDocling 在多個領域表現出色。
🌍 新增對多種語言的支持，增強了模型的應用範圍和靈活性。
詳情鏈接:https://huggingface.co/collections/ibm-granite/granite-docling-682b8c766a565487bcb3ca00

4、Meta發佈首款帶屏幕AI眼鏡Ray-Ban ：隨身佩戴的智能助理

Meta 推出首款帶屏幕的 AI 眼鏡 Ray-Ban，旨在提供更便捷的智能體驗，並與神經腕帶結合實現精準操控，進一步減少對移動設備的依賴。

【AiBase提要:】
📱 右側鏡片內置顯示屏，可呈現應用程序、提醒和導航信息。
🧠 與神經腕帶搭配使用，通過肌電圖技術實現精準操控。
🌐 支持連接雲端，可在眼鏡上使用 Meta 旗下應用及查看路線和實時翻譯。

5、DeepSeek 論文登上 Nature 封面，AI 大模型首次通過同行評審

DeepSeek R1的研究論文成功登上《Nature》封面，標誌着大語言模型首次通過權威同行評審，爲AI行業樹立了新的學術標準。該模型通過強化學習實現自主演化，提升了推理能力，並在數學競賽中表現出色。

【AiBase提要:】
🧠 DeepSeek R1通過強化學習在自主環境中自我演化，發展出複雜的推理能力。
📊 在AIME2024數學競賽中，DeepSeek-R1的表現從15.6%躍升至71.0%，達到與OpenAI模型相當的水平。
🛠️ DeepSeek團隊採用了結合拒絕採樣和監督微調的多階段訓練框架，提升模型寫作能力和整體表現。

6、OpenAI宣佈ChatGPT 網頁端新增 GPT-5 Thinking 調整功能

OpenAI推出了全新的‘Thinking 調整功能’，允許用戶根據需求選擇GPT-5模型的思考時長，從而平衡回覆速度與智能程度。此外，OpenAI還在積極開發兒童版ChatGPT，以確保未成年人使用安全。

【AiBase提要:】
🌟 新功能上線：ChatGPT網頁端推出可調節思考時長的功能，提升用戶體驗。
🛠️ 多種模式選擇：用戶可以選擇標準、擴展、輕量或重度模式，以滿足不同的交流需求。
👶 兒童版開發：OpenAI正在研發兒童版ChatGPT，確保未成年人在使用中的安全。

7、抖音上線 “AI求真” 功能，助你辨別謠言，尋找真相！

抖音推出“AI求真”功能，旨在幫助用戶辨別謠言並尋找真相，提升信息透明度和用戶保護能力。

【AiBase提要:】
🧠 AI 抖音求真功能上線，幫助用戶識別和澄清誤導性信息。
🔍 用戶可點擊鏈接跳轉至“求真卡”頁面獲取完整信息。
📢 平臺通過謠言治理大模型和闢謠團隊提升信息透明度。

8、通義DeepResearch發佈！全開源AI模型讓研究更簡單

通義 DeepResearch 團隊發佈的全開源AI模型在多個權威基準測試中表現出色，其性能甚至超過了許多國際知名模型，同時通過開放的方式推動了AI研究的發展。

【AiBase提要:】
🧠 通義 DeepResearch 團隊發佈了全開源AI模型，使AI從“能聊天”躍升至“會做研究”。
🚀 在多個權威基準測試中取得先進成績，模型性能超越許多國際知名模型。
🌐 模型、框架及方案完全開源，爲全球科技社區提供開放合作的範例。

AI日報：可靈AI發佈數字人新功能；騰訊混元新技術給大模型 “去油”；抖音上線AI求真功能

相關推薦

可靈AI 獲 30 億美元融資，估值達 180 億美元創視頻大模型融資紀錄

可靈AI 融資傳聞再起：180 億美元估值背後的資本博弈

可靈AI將完成30億美元融資騰訊參投，計劃12個月內啓動赴港IPO

百度MEG組織架構調整:升級數字人業務併成立大商業事業部

拒絕彩排，真刀真槍上舞臺!美團LongCat-Video-Avatar1.5開源:全面擊敗主流閉源模型