騰訊混元 TurboS 技術報告全面揭祕，560B參數混合Mamba架構

騰訊發佈了混元 TurboS 技術報告，揭示了其旗艦大語言模型 TurboS 的核心創新與強大能力。

根據全球權威大模型評測平臺 Chatbot Arena 的最新排名，混元 TurboS 在239個參賽模型中位列第七，成爲國內僅次於 Deepseek 的頂尖模型，並在國際上僅落後於谷歌、OpenAI 及 xAI 等幾家機構。

混元 TurboS 模型的架構採用了創新的 Hybrid Transformer-Mamba 結構，這種新穎的設計結合了 Mamba 架構在處理長序列上的高效性與 Transformer 架構在上下文理解上的優勢，從而實現了性能與效率的平衡。該模型總共包含128層，激活參數量高達560億，成爲業界首個大規模部署的 Transformer-Mamba 專家混合模型（MoE）。通過這樣的架構創新，TurboS 在國際權威評測中取得了整體高分1356。

爲了進一步提升模型的能力，混元 TurboS 引入了自適應長短思維鏈機制，能夠根據問題的複雜度自動切換響應模式。這一機制讓模型在處理簡單問題時能夠迅速響應，而在面對複雜問題時，則會深入分析並給出高準確度的答案。此外，團隊還設計了包含監督微調、自適應長短 CoT 融合等四個關鍵模塊的後訓練流程，進一步增強了模型的表現。

在預訓練階段，混元 TurboS 在16萬億 Token 的語料上進行訓練，確保了模型的數據質量和多樣性。其核心架構包含 Transformer、Mamba2和前饋神經網絡（FFN）組件，層級構成合理，最大程度上提升了訓練和推理的效率。

此次技術報告的發佈，不僅展示了騰訊在大語言模型領域的技術實力，也爲今後大模型的發展提供了新的思路與方向。

論文鏈接: https://arxiv.org/abs/2505.15431

劃重點:
🌟 TurboS 模型在 Chatbot Arena 中排名第七，展現了強大的競爭力。
💡 創新的 Hybrid Transformer-Mamba 架構實現了性能與效率的最佳平衡。
🔍 自適應長短思維鏈機制提升了模型在不同複雜度問題下的響應能力。

商湯科技推出元蘿蔔 AI 下棋機器人五合一版，京東 Joy Inside 首度合作

商湯科技旗下的家用機器人品牌 “元蘿蔔 SenseRobot” 在京東發佈了與京東聯合定製的新品 —— 元蘿蔔 AI 下棋機器人五合一版。這款產品是京東 Joy Inside 系列的首款消費類智能硬件，專爲3至12歲的兒童設計，旨在幫助孩子從零基礎開始學習象棋、圍棋、國際象棋、國際跳棋和五子棋五種棋類。元蘿蔔 AI 下棋機器人不僅是孩子的棋類啓蒙老師，還通過京東角色大模型驅動的對話智能體，激發孩子對人工智能的興趣。它能夠進行生動的互動交流，從科學到歷史，提供豐富的百科知識講解。此

一圖生萬物？AI“神筆馬良”3DTown，單張照片變3D城市，這波操作太秀了！

最近，一項黑科技直接顛覆了我們對3D 世界構建的認知!普林斯頓大學、哥倫比亞大學和一家叫 Cyberever AI 的公司，聯手推出了一套名叫3DTown 的框架。聽名字就知道，它就是來幫你搞3D 城鎮的!最騷的是什麼?它能僅僅憑藉一張俯視圖，就能幫你生成一個逼真、連貫的3D 城鎮場景! 而且，它還是個免訓練（training-free）的框架，這意味着你不用費勁巴拉地去收集海量3D 數據來訓練它，直接就能用! 論文地址:https://arxiv.org/pdf/2505.15765項目地址:https://eric-ai-lab.github.io/3dtown.github.io/傳統3D 建模?那是上個

新基準評估語言模型的 “諂媚” 行爲，GPT-4o 表現最爲明顯

最近，隨着 OpenAI 對 GPT-4o 的一些更新進行回撤，關於該模型 “諂媚” 用戶的討論引發了廣泛關注。前 OpenAI 首席執行官埃梅特・希爾（Emmet Shear）和 Hugging Face 首席執行官克萊門特・德朗格(Clement Delangue)均表示，GPT-4o 對用戶的過度讚美令人感到困擾，這種行爲不僅可能導致模型傳播錯誤信息，還可能強化有害行爲。爲了應對這一問題，斯坦福大學、卡內基梅隆大學和牛津大學的研究人員提出了一項新基準，旨在測量大型語言模型（LLM）的諂媚程度。他們將這一基準命名爲 “Elephant”（評估

Anthropic CEO：AI 模型的 “幻覺” 率低於人類

在最近於舊金山舉行的 “與克勞德一起編程” 開發者活動中，Anthropic CEO 達里奧・阿莫迪（Dario Amodei）表示，當前的 AI 模型在 “幻覺” 或製造虛假信息方面，其發生頻率低於人類。他的這一觀點引起了廣泛關注，並且是在他討論 AI 朝着人類水平智能(AGI)發展的過程中提出的。阿莫迪表示，“這實際上取決於我們如何衡量。但我懷疑 AI 模型的幻覺發生率可能低於人類，不過它們的幻覺方式更讓人驚訝。” 他在簡報中強調，儘管許多 AI 領導者認爲幻覺是實現 AGI 的一大障礙，但他認爲這些

Anthropic API增加四大功能：代碼執行工具、MCP連接器、文件API和擴展提示緩存

Anthropic宣佈在其API上推出四項全新功能:代碼執行工具、MCP連接器、文件API以及擴展提示緩存，旨在幫助開發者構建更智能、更高效的AI代理。代碼執行工具:從代碼助手到數據分析師Anthropic推出的代碼執行工具賦予了Claude在沙盒環境中運行Python代碼的能力，使其從單純的代碼編寫助手升級爲強大的數據分析師。這一功能支持Claude直接在API調用中執行數據分析、生成可視化圖表，並處理複雜計算任務。例如，開發者可以利用Claude進行實時數據處理或生成動態可視化內容，大幅提升AI在數據驅動

​騰訊混元 TurboS 技術報告全面揭祕，560B參數混合Mamba架構

相關推薦

​商湯科技推出元蘿蔔 AI 下棋機器人五合一版，京東 Joy Inside 首度合作