先日開催された第2回CCF中国データ大会において、アントデータはその最先端のデータインテリジェントエージェント技術であるAgentar SQLをオープンソース化することを発表しました。この技術の登場により、一般ユーザーでも簡単な日常言語で複雑なビジネスデータの照会や分析を行うことが可能となり、企業のデジタルトランスフォーメーションに強い支援を提供します。

今回のオープンソース化された最初の製品は、リアルタイムテキストを構造化クエリ言語(Text-to-SQL)に変換するフレームワークであり、開発者がデータ照会ソリューションを迅速に構築し、テキストとデータベースの相互作用効率を著しく向上させることが目的です。今後、アントデータはデータベースの理解、業界知識の掘り起こし、リアルタイムでの多ラウンドインタラクションなど、多数の技術を順次公開していく予定です。

ある先進的な都市銀行での試運転期間中、Agentar SQLのいくつかのツールは92%以上の照会精度を示し、従来の方法に比べて3倍以上も向上しました。また驚くべきことに、アントデータのインテリジェントエージェント技術は、世界的権威のある自然言語からSQLへの変換評価基準BIRD-SQLで上位を記録し、グーグルなどの国際的な大手を凌駕し、業界のリーダーとしての地位を確立しています。

image.png

BIRD-SQLの評価の難易度は非常に高く、金融、電力、医療など37の実際のシナリオが含まれており、タスクは複雑でデータ量も多く、世界で最も挑戦的なNL2SQLテストの一つとなっています。研究機関によると、2025年までに世界のビジネスインテリジェンス市場規模は474億8,000万ドルに達すると予測され、中国の市場も急速に拡大し、2028年には17億9,000万ドルに達し、年平均成長率は12.7%になると見込まれています。

アントデータの技術責任者であるチャン・ポン氏は、大会でNL2SQLの実際の応用では、人間の口語の曖昧性を理解すること、業界専門知識を統合すること、複雑なデータベース構造を解析すること、正確なSQL文を生成することなど、多くの課題に直面していると指摘しました。したがって、単純なモデルだけでは十分ではありません。

チャン氏は強調しました。産業で利用可能なNL2SQLおよびデータインテリジェントエージェント技術を真正に実現するためには、完全な能力体系を構築することが必要です。これはデータベースの深い理解、インテリジェントエージェントとユーザーとの効果的な対話、そして自己進化の能力を含みます。アントデータは今後、より包括的な能力モジュールを継続的にオープンソース化し、スマートデータ分析の普及をさらに推進する予定です。

Agentar-Scale-SQLのオープンソース内容は、arXiv、GitHubなど複数のプラットフォームで公開されており、開発者の広範な注目を集めています。