阿里雲析言 XiYan-SQL 強勢奪冠，全球 SQL 診斷評測榜單第一！

最近，阿里雲飛天實驗室自主研發的數據分析智能體 “析言 XiYan-SQL” 在全球權威的 SQL 診斷評測基準 BIRD-CRITIC（也稱 SWE-SQL）中表現優異，成功登頂所有開放榜單，超越了多家國內外頂尖團隊，刷新了 SQL 診斷與修復的行業紀錄。

BIRD-CRITIC 基準是由學術界與 Google Cloud 合作推出，旨在探討 “大語言模型能否解決真實數據庫應用中的用戶問題”。該評測將企業中常見的數據庫報錯、性能問題和查詢需求整理成題目，涵蓋了 MySQL、PostgreSQL、SQL Server、Oracle 等主流數據庫系統。評測題目既包括簡單查詢，也包含複雜的插入、更新、刪除操作，還涉及許多模型之前未見過的新場景，整體難度遠高於傳統的 “自然語言生成 SQL” 測試。

在這項評測中，析言 XiYan-SQL 在 BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG 和 BIRD-CRITIC-Flash 三個重要榜單上均取得第一名的好成績，並在跨方言魯棒性、複雜 SQL 處理能力、真實問題修復率和分佈外泛化等多個維度得到了權威驗證。

技術方面，析言 XiYan-SQL 通過相關模式篩選（Schema Filter）、多生成器集成(Multi-Generator Ensemble)、候選重組與最優選擇(Selection with Candidate Reorganization)等創新手段，使得模型既能夠生成高質量的 SQL，同時也兼顧了可執行性和可維護性。這一模型可以在存在髒數據、異構模式以及跨方言差異的真實系統中，提供高可用的診斷與修復方案。

目前，基於 XiYan-SQL 技術打造的生成式商業智能（GBI）產品 “析言” 已在阿里雲百鍊平臺上線，提供 SQL 生成與診斷服務。

劃重點:
🔍 析言 XiYan-SQL 在 BIRD-CRITIC 評測中斬獲第一，超越衆多頂尖團隊。
📊 該評測涵蓋多種主流數據庫，難度高於傳統 SQL 生成測試。
💻 相關技術和模型已開源，支持開發者進行體驗與貢獻。

國產算力“軍團”集結：萬卡推理引擎+開元模型同日發佈

2025光明科學城論壇在深圳舉行，聚焦智能算力與大模型智能體。鵬城實驗室等機構發佈四項重要成果：鵬城腦海2.1開源多模態模型及配套數據集與工具鏈；國產萬卡推理引擎FenixCOS首次亮相，支持大規模並行與高效切換；氣象智能體“阿福”接入鵬城雲腦Ⅲ，將服務第十五屆全國運動會。

戴森在中國發布創新真 Ai 清潔機器人，售價5499元起

戴森在中國市場推出兩款清潔新品：售價5499元起的“真Ai清潔機器人”和3499元起的Clean+Wash Hygiene洗地機。新品融合人工智能與光學探測技術，具備感知、識別、適應、行動的全鏈路智能功能，旨在滿足中國消費者對智能清潔解決方案的需求。

阿里雲析言 XiYan-SQL 強勢奪冠，全球 SQL 診斷評測榜單第一！

相關推薦

24歲CEO把“人訓AI”做成百億賽道！Micro1 ARR一年飆至1億美元，劍指機器人預訓練數據金礦

國產算力“軍團”集結：萬卡推理引擎+開元模型同日發佈

OpenRouter發佈100萬億token AI使用狀態報告

戴森在中國發布創新真 Ai 清潔機器人，售價5499元起

OpenAI 推出 “懺悔” 機制旨在揭示 AI 潛在不當行爲

​阿里雲析言 XiYan-SQL 強勢奪冠，全球 SQL 診斷評測榜單第一！

相關推薦

24歲CEO把“人訓AI”做成百億賽道！Micro1 ARR一年飆至1億美元，劍指機器人預訓練數據金礦

國產算力“軍團”集結：萬卡推理引擎+開元模型同日發佈

OpenRouter發佈100萬億token AI使用狀態報告

戴森在中國發布創新真 Ai 清潔機器人，售價5499元起

​OpenAI 推出 “懺悔” 機制 旨在揭示 AI 潛在不當行爲

阿里雲析言 XiYan-SQL 強勢奪冠，全球 SQL 診斷評測榜單第一！

OpenAI 推出 “懺悔” 機制旨在揭示 AI 潛在不當行爲