西藏首個千億參數藏語大模型“陽光清言”問世，人工智能在高原邁入新階段

全球海拔最高的大語言模型正式誕生。西藏大學與本土創業團隊聯合發佈的“陽光清言”V1.0今日亮相，模型參數量突破千億，訓練語料達288億Token，覆蓋新聞、法律、醫學、教育、科技等全領域，一舉填補藏語AI基礎設施的空白。

國務院8月印發的《“人工智能+”行動意見》被視作西藏AI提速的發令槍。目前，拉薩主城區社區服務中心、貢嘎機場航站樓已率先接入AI客服與實時翻譯系統;正在進行的青藏科考中，“e科考”App藉助衛星鏈路完成全息影像採集與雲端秒級回傳，科考隊野外數據整理時間縮短一半。

元宇宙科幻賽博朋克繪畫 (1)大模型

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

藏語數字化奠基人、西藏大學教授尼瑪扎西院士表示，西藏AI正從“場景應用”邁向“系統研發”，核心突破口在於語料。青年創業者旦增羅布團隊用六年時間搭建7000萬條藏漢平行語料庫，並建立覆蓋140國多語種語音數據庫，爲“陽光清言”和年底即將開放的DeepZang模型提供數據底座。

“模型上線後，政務辦事、遠程醫療、生態監測均可實現母語交互，藏語傳承不再依賴紙質檔案。”尼瑪扎西說。業內普遍認爲，千億參數藏語大模型的出現，爲其他低資源語言智能化提供了可複製的高原樣本。

Epoch AI測試三大AI文本檢測器:模仿人類文風后最高近三成內容漏檢

Epoch AI研究顯示，主流AI文本檢測器能近乎完美識別普通AI生成內容，但當大語言模型刻意模仿特定作者寫作風格時，準確率明顯下降，科學寫作最難辨別。實驗測試了Pangram、GPTZero和Originality.ai三款工具，採用495篇涵蓋博客、小說、科學的人類原創文本（均創作於ChatGPT問世前），發現風格模仿可有效逃逸檢測。

西藏首個千億參數藏語大模型“陽光清言”問世，人工智能在高原邁入新階段

相關推薦

Epoch AI測試三大AI文本檢測器:模仿人類文風后最高近三成內容漏檢

OpenAI人才流動：前研究員田永龍入職騰訊，深耕視覺語言模型研發

以 AI 治理 AI：Reddit 升級自動化系統，日均攔截 2300 萬條垃圾信息

Anthropic發佈重磅大模型Claude Sonnet 5：性能直逼旗艦，價格卻大跳水

降本增效大動作：Meta 大規模啓用 AI 接管內容審覈