最近、サウジアラビアのAIラボであるMisraj AIは、AWS re:Inventカンファレンスで新たにアラビア語の大規模言語モデルKawnをリリースしました。このモデルは、さまざまな業界におけるアラビア語のコミュニケーションを促進し、アラビア語の利用をサポートするための多様なモデルとサービスを提供することを目的としています。

Kawnモデルの重要な特徴の一つは、Mutarjimです。これは、アラビア語と英語の双方向翻訳モデルです。また、Lahjawiは15種類のアラビア語方言をサポートする初めての翻訳モデルであり、異方言間のコミュニケーションがより便利になり、チャットボットやカスタマーサポートなどのシナリオに特に適しています。Kawnには、Kawn Document OCRという視覚言語モデルも含まれており、文書中のアラビア語テキストを認識および抽出できます。

アラビア アラブ首長国連邦

図の出典:画像はAIによって生成され、画像のライセンス提供元はMidjourneyです

Misraj AIのCEOであるSafwan AlModhayan氏は、Kawnのリリースは市場における高品質なアラビア語のローカルAIシステムの空白を埋めるために行われたと述べました。彼は、多くの既存のAIモデルが英語用に最初に構築され、その後アラビア語への対応が行われたため、正確性、方言サポート、政府、医療、金融、教育などの重要な分野での信頼性に問題があると指摘しました。

Kawnを構築するために、チームはいくつかの課題に直面しました。そのうちの一つは、アラビア地域の広範な方言をカバーできるモデルを設計することでした。そのため、Misrajは層注入という技術を開発し、モデル全体を再トレーニングせずに方言の変化を学習できるようにしました。もう一つの課題は、クリーンで代表的なアラビア語データセットが不足していることでした。この問題に対処するために、チームは複数の分野と地域から2兆以上のアラビア語トークンを収集・精製し、厳格なフィルタリングと品質管理プロセスを確立しました。

Kawnに加えて、MisrajはWorkforcesというAIプラットフォームをリリースしました。このプラットフォームでは、ユーザーがAIエージェントを作成および管理でき、業務フローの自動化、データ分析、ビジネス拡大が可能です。このプラットフォームは、オペレーション、カスタマーサポート、マーケティング、セールスなどのチームに適しており、企業が繰り返し作業を自動化し、生産性を向上させるのに役立ちます。

AlModhayan氏は、KawnとWorkforcesはアラビアのデジタルトランスフォーメーションの新しい時代を推進するものであると述べました。彼らは、あらゆる業界の機関や企業が、自然にアラビア語を使用し、地域のプロセスを理解し、既存のシステムとシームレスに統合できるAIソリューションを展開することを支援したいと考えています。将来の展望として、Misrajはさらにプラットフォームを拡張し、医療、法務、保険、ビジネス、教育、公共サービスなどの業界向けの専門モデルをリリースする予定です。同時に、テキスト、音声、視覚を組み合わせたより豊かなマルチモーダル機能を開発中で、ユーザーにインタラクティブな体験を提供することを目指しています。

要点:

🌟 Kawnは初のアラビア語大規模言語モデルで、アラビア語のコミュニケーションと翻訳をサポートしています。

🔍 このモデルはアラビア語の方言の多様性とデータセットの不足という課題を克服しました。

🚀 MisrajはAIプラットフォームWorkforcesをリリースし、企業の業務フローの自動化を助けます。