近日,沙特阿拉伯的 AI 實驗室 Misraj AI 在 AWS re:Invent 大會上推出了其全新的阿拉伯語大語言模型 Kawn。該模型旨在促進各行業的阿拉伯語交流,提供多種模型和服務,以支持阿拉伯語的應用。
Kawn 模型的一個重要特點是 Mutarjim,這是一種雙向阿拉伯語 - 英語翻譯模型。此外,Lahjawi 是首個支持15種阿拉伯方言的翻譯模型,使得跨方言交流變得更加便利,特別適合用於聊天機器人和客戶支持等場景。Kawn 還包含 Kawn Document OCR,這是一個視覺語言模型,能夠識別和提取文件中的阿拉伯文本。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
Misraj AI 的首席執行官 Safwan AlModhayan 表示,Kawn 的推出旨在填補市場上高質量阿拉伯本土 AI 系統的空白。他指出,許多現有的 AI 模型最初是爲英語構建的,隨後才進行了阿拉伯語適配,這導致了在準確性、方言支持以及在政府、醫療、金融和教育等重要領域中的可靠性方面存在不足。
爲了構建 Kawn,團隊面臨諸多挑戰,包括如何設計出能夠覆蓋阿拉伯地區廣泛方言的模型。爲此,Misraj 開發了一種稱爲層注入的技術,可以讓模型在不重新訓練整個模型的情況下學習方言變化。另一個挑戰是缺乏乾淨且具有代表性的阿拉伯數據集。爲了應對這一問題,團隊從多個領域和地區收集和精煉了超過2萬億個阿拉伯語標記,並建立了嚴格的過濾和質量管控流程。
除了 Kawn,Misraj 還推出了 Workforces,這是一個 AI 平臺,用戶可以通過它創建和管理 AI 代理,以自動化工作流程、分析數據並擴展業務。該平臺適用於操作、客戶支持、營銷和銷售等團隊,旨在幫助企業自動化重複性流程,提高生產力。
AlModhayan 表示,Kawn 和 Workforces 旨在推動阿拉伯數字化轉型的新紀元。他們希望幫助各個行業的機構和企業,部署能自然使用阿拉伯語、理解地區流程並能與現有系統無縫集成的 AI 解決方案。展望未來,Misraj 計劃進一步擴展該平臺,推出針對醫療、法律、保險、商業、教育和公共服務等行業的專業模型。同時,他們還在開發更豐富的多模態能力,結合文本、語音和視覺,爲用戶提供更具互動性的體驗。
劃重點:
🌟 Kawn 是首個阿拉伯語大語言模型,支持阿拉伯語交流與翻譯。
🔍 該模型克服了阿拉伯方言多樣性和數據集稀缺的挑戰。
🚀 Misraj 還推出了 AI 平臺 Workforces,助力企業自動化工作流程。
