騰訊混元攜手科研機構推出首個多模態統一CoT獎勵模型並開源

近日，騰訊混元在與上海 AI Lab、復旦大學及上海創智學院的合作下，正式推出了全新研究成果 —— 統一多模態獎勵模型（Unified Reward-Think），並宣佈全面開源。這一創新模型不僅具備了強大的長鏈推理能力，還首次實現了在視覺任務中 “思考” 的能力，使得獎勵模型能夠更準確地評估複雜的視覺生成與理解任務。

統一多模態獎勵模型的推出，標誌着獎勵模型在各類視覺任務中的應用達到了新的高度。過去，許多視覺任務往往面臨評估不準確和推理能力不足的問題。而這一新模型的研發，正是爲了克服這些侷限性。通過深度學習和多模態融合技術，模型能夠在多種視覺任務中進行跨任務的泛化與推理，提高了可解釋性。這意味着，在進行圖像生成、圖像理解等任務時，模型能夠更全面地考慮各種因素，從而作出更爲合理的判斷。

元宇宙科幻賽博朋克繪畫 (4)大模型

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

該項目的開源不僅使得科研人員可以自由使用這一模型，還爲整個 AI 社區的研究提供了更廣闊的平臺。騰訊混元表示，開源內容包括模型、數據集、訓練腳本和評測工具，這將有助於推動相關領域的進步與創新。科研人員和開發者可以基於此模型進行深入研究，探索更多應用場景。

此外，騰訊混元的這一舉動，也體現了其在人工智能領域持續的創新和開放態度。在全球範圍內，人工智能技術的快速發展，促使各大科技公司紛紛加大研發力度，推出更具前瞻性的技術與應用。騰訊混元此次開源的統一多模態獎勵模型，正是這一潮流的縮影。

隨着這一模型的發佈與開源，未來在多模態 AI 研究、視覺任務評估等方面，我們將會看到更多的可能性和應用前景。

字節跳動發佈新一代多模態大模型，挑戰谷歌 Gemini 2.5 Pro

在人工智能領域競爭日益激烈的今天，字節跳動的 Seed 團隊於5月13日正式發佈了其最新的多模態大模型 Seed1.5-VL，旨在爲智能體技術的進步鋪平道路。該模型經過超過3萬億 tokens 的多模態數據預訓練，不僅具備強大的通用多模態理解和推理能力，還顯著降低了推理成本。與谷歌近期推出的 Gemini2.5Pro 相比，Seed1.5-VL 在性能上表現不相上下。谷歌的 Gemini2.5Pro 支持圖像、視頻、音頻和代碼的統一理解，並在多個基準測試中領先於 GPT-4.0。字節跳動的 Seed 團隊表示，儘管 Seed1.5-VL 的激活參數僅爲2

螞蟻數科企業級AI產品全線出海加速海外市場智能化升級

近日，在迪拜金融科技峯會2025期間，螞蟻數科國際業務負責人陳逸石在演講時透露，螞蟻數科旗下企業級AI產品正在全線出海，服務海外市場客戶數字化與智能化升級。據瞭解，這也是螞蟻數科首次在海外市場展示其全棧AI產品矩陣。陳逸石表示:“以大模型爲代表的前沿科技正在重塑金融服務，帶來效率與體驗的變革。螞蟻數科在國內市場積累了豐富的AI技術與行業實踐，我們將加大海外本土化運營策略，助力更多海外機構能享受到技術創新帶來的發展紅利。”圖說:螞蟻數科國際業務負責

特朗普計劃利用 AI 芯片優勢推動中東合作

美國總統唐納德・特朗普在本週的中東訪問中，人工智能（AI）芯片成爲了討論的重點。根據《紐約時報》的最新報道，沙特阿拉伯和阿聯酋等海灣國家希望從美國公司獲得先進的 AI 芯片，而特朗普政府似乎對此持開放態度，準備促進相關交易。圖源備註：圖片由AI生成，圖片授權服務商Midjourney這一變化與拜登政府的限制政策形成鮮明對比。拜登政府時期，美國限制了沙特阿拉伯和阿聯酋等國購買 AI 芯片的數量，原因在於擔心這些技術可能被轉移到中國。對此，NVIDIA 和 Oracle 等公司表達了

逆天改命！Flow-GRPO 讓圖像生成模型秒變 “大神”

家人們，今天必須給你們嘮嘮科研界的一項超酷新成果 ——Flow-GRPO!這東西可不得了，它就像是給圖像生成模型打了一針 “超級進化劑”，直接讓它們從 “青銅” 一路飆升到 “王者”。想知道它是怎麼做到的嗎?快搬好小板凳，聽我細細道來!圖像生成模型的 “成長煩惱”現在的圖像生成模型，比如基於流匹配（Flow matching）的那些，理論基礎那叫一個紮實，生成的高質量圖像也讓人眼前一亮。但它們也有自己的 “小煩惱”，遇到複雜場景，像要安排好多物體、處理各種屬性和關係，或者

中國版Cursor！騰訊推出 AI 編程助手 CodeBuddy

騰訊推出了一款新的代碼助手插件 ——CodeBuddy3.0。這款產品與微信小程序的開發工具實現了深度整合，標誌着騰訊在開發者生態中的又一重要佈局。CodeBuddy 並不是一個獨立的集成開發環境（IDE），而是一個可安裝在各種開發工具中的插件，方便開發者在不同的編碼平臺上使用。CodeBuddy主要亮點之一是其創新的 Craft 模式。該模式使得 AI 能夠自主理解用戶需求，並完成多文件的代碼生成和改寫。用戶只需通過簡單的自然語言指令，AI 便能自動生成可執行的應用項目。這意味着開發者不再僅僅

騰訊混元攜手科研機構推出首個多模態統一CoT獎勵模型並開源

相關推薦

字節跳動發佈新一代多模態大模型，挑戰谷歌 Gemini 2.5 Pro

螞蟻數科企業級AI產品全線出海 加速海外市場智能化升級

​特朗普計劃利用 AI 芯片優勢推動中東合作

逆天改命！Flow-GRPO 讓圖像生成模型秒變 “大神”

中國版Cursor！騰訊推出 AI 編程助手 CodeBuddy

螞蟻數科企業級AI產品全線出海加速海外市場智能化升級

特朗普計劃利用 AI 芯片優勢推動中東合作