在近日舉辦的第二屆 CCF 中國數據大會上,螞蟻數科重磅宣佈將開源其先進的數據智能體技術 ——Agentar SQL。這一技術的推出,讓普通用戶也能通過簡單的日常語言來進行復雜的商業數據查詢和分析,爲企業的數字化轉型提供了強有力的支持。
此次開源的首個產品是實時文本轉結構化查詢語言(Text-to-SQL)框架,旨在幫助開發者快速搭建數據查詢方案,顯著提升文本與數據庫的交互效率。未來,螞蟻數科還將陸續推出涵蓋數據庫理解、行業知識挖掘及實時多輪交互等多項技術,全面提升數據處理能力。
在某領先的城市商業銀行試運營期間,Agentar SQL 的多個工具顯示出超過92% 的查詢準確率,比傳統方案提升了超過三倍。更令人驚喜的是,螞蟻數科的智能體技術在全球權威的自然語言轉 SQL 評測基準 BIRD-SQL 中名列前茅,超越了 Google 等國際巨頭,成爲行業領跑者。

BIRD-SQL 評測的難度不容小覷,其數據集涵蓋金融、電力和醫療等37個真實場景,任務複雜且數據量龐大,令其成爲全球最具挑戰性的 NL2SQL 測試之一。研究機構預計,到2025年,全球商業智能市場規模將達到474.8億美元,而中國的市場也將迅速擴大,預計到2028年將達到17.9億美元,年複合增長率將達到12.7%。
螞蟻數科的技術負責人章鵬在大會上指出,NL2SQL 在實際應用中面臨着理解人類口語模糊性、整合行業專業知識、解析複雜數據庫結構以及生成準確 SQL 語句等多重挑戰。因此,僅僅依靠簡單的模型是遠遠不夠的。
章鵬強調,要真正實現產業可用的 NL2SQL 及數據智能體技術,必須建立完整的能力體系。這包括對數據庫的深入理解、智能體與用戶的有效交互以及自我進化的能力。螞蟻數科計劃在未來不斷開源更全面的能力模塊,進一步推動智能數據分析的普及。
Agentar-Scale-SQL 的開源內容已經在 arXiv、GitHub 等多個平臺發佈,受到了開發者的廣泛關注。
