阿布扎比的人工智能集團 G42於週二正式發佈了 NANDA87B,這是一款擁有87億參數的開源印英大型語言模型,標誌着其早期版本 NANDA 的升級。NANDA87B 現已在 MBZUAI 的 Hugging Face 頁面上以開放權重的形式提供,開發者、創作者和企業可以自由使用並擴展其功能。

這款模型由穆罕默德・本・扎耶德人工智能大學(MBZUAI)與 G42旗下的 Inception 公司及芯片製造商 Cerebras 合作開發。NANDA87B 是基於 Llama-3.170B 模型構建的,並在超過650億個印地語標記上進行訓練,採用印地語專用的分詞器,以提高訓練和推理的效率。

G42印度首席執行官馬努・賈因表示:“印度應當擁有能夠說其語言的世界級技術。NANDA87B 是朝着這一目標邁出的重要一步。” 他補充說,該模型旨在支持印度 AI 生態系統中的教育、娛樂和企業等多個領域的創新。

G42表示,NANDA87B 設計能夠處理正式印地語、日常口語和混合印地語(Hinglish),並能夠執行翻譯、摘要、指令跟隨和音譯等多項任務。該公司還強調,模型的設計過程中考慮了安全性和文化一致性,以確保輸出結果的責任性。

穆罕默德・本・扎耶德人工智能大學基礎模型研究所執行董事理查德・莫頓表示,此次發佈標誌着擴展高級語言技術可及性的重大進展。“NANDA 標誌着爲全球最大語言社區之一提供高質量、開放訪問語言技術的重要里程碑,” 他說。

NANDA87B 的訓練是在 G42和 Cerebras 聯合打造的 Condor Galaxy 超級計算系統上進行的。

劃重點:

🌟 NANDA87B 是 G42推出的87億參數開源印英語言模型,旨在促進印度的技術發展。  

💻 模型支持正式印地語、日常口語和混合印地語,可執行多種語言處理任務。  

🔍 此次發佈標誌着對高級語言技術可及性的擴展,推動全球最大語言社區的技術進步。