最近,阿里雲飛天實驗室自主研發的數據分析智能體 “析言 XiYan-SQL” 在全球權威的 SQL 診斷評測基準 BIRD-CRITIC(也稱 SWE-SQL)中表現優異,成功登頂所有開放榜單,超越了多家國內外頂尖團隊,刷新了 SQL 診斷與修復的行業紀錄。

BIRD-CRITIC 基準是由學術界與 Google Cloud 合作推出,旨在探討 “大語言模型能否解決真實數據庫應用中的用戶問題”。該評測將企業中常見的數據庫報錯、性能問題和查詢需求整理成題目,涵蓋了 MySQL、PostgreSQL、SQL Server、Oracle 等主流數據庫系統。評測題目既包括簡單查詢,也包含複雜的插入、更新、刪除操作,還涉及許多模型之前未見過的新場景,整體難度遠高於傳統的 “自然語言生成 SQL” 測試。
在這項評測中,析言 XiYan-SQL 在 BIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG 和 BIRD-CRITIC-Flash 三個重要榜單上均取得第一名的好成績,並在跨方言魯棒性、複雜 SQL 處理能力、真實問題修復率和分佈外泛化等多個維度得到了權威驗證。
技術方面,析言 XiYan-SQL 通過相關模式篩選(Schema Filter)、多生成器集成(Multi-Generator Ensemble)、候選重組與最優選擇(Selection with Candidate Reorganization)等創新手段,使得模型既能夠生成高質量的 SQL,同時也兼顧了可執行性和可維護性。這一模型可以在存在髒數據、異構模式以及跨方言差異的真實系統中,提供高可用的診斷與修復方案。
目前,基於 XiYan-SQL 技術打造的生成式商業智能(GBI)產品 “析言” 已在阿里雲百鍊平臺上線,提供 SQL 生成與診斷服務。
劃重點:
🔍 析言 XiYan-SQL 在 BIRD-CRITIC 評測中斬獲第一,超越衆多頂尖團隊。
📊 該評測涵蓋多種主流數據庫,難度高於傳統 SQL 生成測試。
💻 相關技術和模型已開源,支持開發者進行體驗與貢獻。
