香港でのフィンテックフェスティバルにおいて、アント・データは画期的な技術である「多言語マルチモーダル大規模モデルトレーニングフレームワーク」を発表しました。この技術は、現在の大きなモデルが多言語環境で使用する際の課題を克服することを目的としています。特に、資源が限られている小言語、例えばエジプトアラビア語、インドネシア語のジャワ語、バハサ語、スンダ語などに対して、非常に大きな可能性を示しています。
この革新技術の中心は、独自の言語認識最適化フレームワークにあります。このフレームワークは、「目的言語で考える」メカニズムを採用し、細粒度で多次元的な報酬戦略と自動データソリューションを組み合わせることで、小言語の理解と処理能力を大幅に向上させています。テスト結果によると、アント・データの新フレームワークは主流の多言語ビジョナルクエスチョンアンドアンサー(Multilingual Visual Question Answering、VQA)ベンチマークテストにおいて、同規模のオープンソースモデルよりも約9.5%の精度向上を達成しました。また、一部のタスクでは、GPT-4oやGemini-2.5-flashなどの国際的な主要なクローズドソースモデルを上回る性能を示し、評価総合得点第1位を獲得しました。
言語モデルの突破に加え、アント・データは画像セキュリティフレームワークも発表しました。この技術は視覚分析と常識推論を組み合わせ、画像内の偽造や不一致を効率的に識別することができます。新しいフレームワークは、改変された領域を正確に特定するだけでなく、説明可能な分析を提供し、デジタルコンテンツのリスク管理能力を顕著に向上させました。この技術の成功的な実装により、さまざまなシナリオにおけるデジタルコンテンツ保護をより強力に支援することが可能になります。
アント・データのグローバルビジネスのコア技術として、これらの能力はZOLOZのドキュメント認識および真偽判定製品(RealDoc)で広く応用されており、119の言語をサポートし、さまざまなビジネス文書、契約書、証明書を効率的に処理できます。保険請求、信用審査、および国際貿易などの多くの分野をカバーしています。これは、アント・データが多言語処理分野でのリーダーシップを示すとともに、グローバルユーザーにとってより良いサービス体験を提供することを示しています。
