全球海拔最高的大语言模型正式诞生。西藏大学与本土创业团队联合发布的“阳光清言”V1.0今日亮相,模型参数量突破千亿,训练语料达288亿Token,覆盖新闻、法律、医学、教育、科技等全领域,一举填补藏语AI基础设施的空白。
国务院8月印发的《“人工智能+”行动意见》被视作西藏AI提速的发令枪。目前,拉萨主城区社区服务中心、贡嘎机场航站楼已率先接入AI客服与实时翻译系统;正在进行的青藏科考中,“e科考”App借助卫星链路完成全息影像采集与云端秒级回传,科考队野外数据整理时间缩短一半。

图源备注:图片由AI生成,图片授权服务商Midjourney
藏语数字化奠基人、西藏大学教授尼玛扎西院士表示,西藏AI正从“场景应用”迈向“系统研发”,核心突破口在于语料。青年创业者旦增罗布团队用六年时间搭建7000万条藏汉平行语料库,并建立覆盖140国多语种语音数据库,为“阳光清言”和年底即将开放的DeepZang模型提供数据底座。
“模型上线后,政务办事、远程医疗、生态监测均可实现母语交互,藏语传承不再依赖纸质档案。”尼玛扎西说。业内普遍认为,千亿参数藏语大模型的出现,为其他低资源语言智能化提供了可复制的高原样本。
