最近、アリババクラウドのFeitianラボが自主開発したデータ分析インテリジェントエージェント「XiYan-SQL」が、世界的な権威あるSQL診断評価基準であるBIRD-CRITIC(SWE-SQLとも呼ばれる)で優れた成績を収め、すべてのオープンランキングに登場し、国内外の多くのトップチームを上回り、SQL診断と修復に関する業界記録を更新しました。

BIRD-CRITICは学術界とGoogle Cloudが共同で導入した評価基準であり、「大規模言語モデルが現実的なデータベースアプリケーションにおけるユーザーの問題を解決できるか」を探究することを目的としています。この評価では、企業で一般的なデータベースのエラー、パフォーマンス上の問題、クエリの要件などを問題としてまとめ、MySQL、PostgreSQL、SQL Server、Oracleなどの主要なデータベースシステムをカバーしています。出題内容には単純なクエリだけでなく、複雑な挿入・更新・削除操作も含まれており、モデルがこれまで見たことのない新しいシナリオも含まれており、従来の「自然言語からSQL生成」テストよりも格段に難易度が高いです。
この評価において、XiYan-SQLはBIRD-CRITIC-1.0-Open、BIRD-CRITIC-PG、BIRD-CRITIC-Flashの3つの重要なランキングでいずれも第1位を獲得し、マルチダイアレクト耐性、複雑なSQL処理能力、現実的な問題の修正率、分布外一般化などの多様な側面で専門家の検証を受けました。
技術面では、XiYan-SQLは関連するスキーマフィルタリング(Schema Filter)、マルチジェネレーターエンサンブル(Multi-Generator Ensemble)、候補の再構築と最適選択(Selection with Candidate Reorganization)などの革新的な手法を採用しており、モデルが高品質なSQLを生成するだけでなく、実行可能性と保守性にも配慮しています。このモデルは、汚染データや異種のスキーマ、マルチダイアレクトの違いがある実際のシステムでも、高信頼性のある診断と修復ソリューションを提供できます。
現在、XiYan-SQL技術を基盤とした生成型ビジネスインテリジェンス(GBI)製品「XiYan(析言)」はアリババクラウドの百煉プラットフォームにリリースされ、SQL生成と診断サービスを提供しています。
ポイント:
🔍 XiYan-SQLはBIRD-CRITIC評価で首位を獲得し、多くのトップチームを上回りました。
📊 この評価はさまざまな主要なデータベースをカバーしており、従来のSQL生成テストよりも難易度が高いです。
💻 これらの技術とモデルはオープンソースになっており、開発者が体験や貢献を行うことをサポートしています。
