全球海拔最高的大語言模型正式誕生。西藏大學與本土創業團隊聯合發佈的“陽光清言”V1.0今日亮相,模型參數量突破千億,訓練語料達288億Token,覆蓋新聞、法律、醫學、教育、科技等全領域,一舉填補藏語AI基礎設施的空白。
國務院8月印發的《“人工智能+”行動意見》被視作西藏AI提速的發令槍。目前,拉薩主城區社區服務中心、貢嘎機場航站樓已率先接入AI客服與實時翻譯系統;正在進行的青藏科考中,“e科考”App藉助衛星鏈路完成全息影像採集與雲端秒級回傳,科考隊野外數據整理時間縮短一半。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
藏語數字化奠基人、西藏大學教授尼瑪扎西院士表示,西藏AI正從“場景應用”邁向“系統研發”,核心突破口在於語料。青年創業者旦增羅布團隊用六年時間搭建7000萬條藏漢平行語料庫,並建立覆蓋140國多語種語音數據庫,爲“陽光清言”和年底即將開放的DeepZang模型提供數據底座。
“模型上線後,政務辦事、遠程醫療、生態監測均可實現母語交互,藏語傳承不再依賴紙質檔案。”尼瑪扎西說。業內普遍認爲,千億參數藏語大模型的出現,爲其他低資源語言智能化提供了可複製的高原樣本。
