アブダビの人工知能グループG42は火曜日にNANDA87Bを正式に発表しました。これは870億パラメータを持つオープンソースのイングリッシュ・ヒンディー語用の大規模言語モデルで、初期バージョンであるNANDAのアップグレードを示しています。NANDA87BはMBZUAIのHugging Faceページでオープンウェイトとして提供されており、開発者、クリエイター、企業が自由に使用し、機能を拡張できます。

このモデルは、ムハンマド・ベン・ザイド・アートificialインテリジェンス大学(MBZUAI)とG42傘下のInception社およびチップメーカーCerebrasによる共同開発です。NANDA87BはLlama-3.170Bモデルに基づいて構築され、650億以上のヒンディー語タグで訓練されており、ヒンディー語専用のトークナイザを使用して、トレーニングと推論の効率を向上させています。

G42インドCEOのマヌ・ジャイン氏は、「インドは自国の言語を話せる世界レベルの技術を持つべきだ。NANDA87Bはその目標に向かう重要な一歩だ」と述べました。彼はさらに、このモデルがインドのAIエコシステムにおける教育、エンターテイメント、企業など多くの分野でのイノベーションを支援することを目的としていると説明しました。

G42によると、NANDA87Bは公式ヒンディー語、日常的な口語、そして混合ヒンディー語(Hinglish)を処理でき、翻訳、要約、指示追従、音声入力などの複数のタスクを実行できます。同社はまた、モデルの設計過程においてセキュリティ性と文化的整合性が考慮され、出力結果の責任性を確保していると強調しています。

ムハンマド・ベン・ザイド・アートificialインテリジェンス大学の基礎モデル研究機関の執行役員であるリチャード・モートン氏は、「今回のリリースは、高級な言語技術へのアクセスを拡大する重要な進展を示しています。」と語りました。「NANDAは、世界最大の言語コミュニティの一つに高品質でオープンアクセスな言語技術を提供する重要な出来事です。」

NANDA87Bのトレーニングは、G42とCerebrasが共同で構築したCondor Galaxyスーパーコンピューティングシステム上で行われました。

ポイント:

🌟 NANDA87Bは、G42が公開した870億パラメータのオープンソースのイングリッシュ・ヒンディー語用言語モデルであり、インドの技術発展を促進することを目的としています。

💻 このモデルは、公式ヒンディー語、日常的な口語、および混合ヒンディー語(Hinglish)をサポートしており、さまざまな言語処理タスクを実行できます。

🔍 今回のリリースは、高級な言語技術へのアクセスの拡大を示し、世界最大の言語コミュニティの技術革新を推進しています。