國產大模型再迎重磅突破。中國電信人工智能研究院(TeleAI)近日正式開源星辰語義大模型TeleChat3系列,包含國內首個基於全國產算力訓練的千億參數細粒度MoE模型——TeleChat3-105B-A4.7B-Thinking,以及稠密架構的TeleChat3-36B-Thinking。該系列模型完全依託上海臨港國產萬卡算力池訓練,基礎訓練數據達15萬億tokens,標誌着我國在超大規模AI模型自主可控方面邁出關鍵一步。

全棧國產化:從芯片到框架全鏈路適配
TeleChat3系列深度適配華爲昇騰生態:
- 支持昇騰Atlas800T A2訓練服務器;
- 基於昇思MindSpore框架開發;
- 訓練與推理全流程運行於國產AI算力基礎設施。
此舉不僅驗證了國產軟硬件棧支撐千億級大模型的能力,也爲行業提供了一條安全、可靠、可替代的技術路徑,對保障AI基礎設施供應鏈安全具有戰略意義。

創新“Thinking模式”:讓AI推理過程可追溯
TeleChat3全系引入Thinking(思考模式)機制——通過在對話模板中加入特定引導符號,模型可自動生成中間推理步驟,顯著提升在複雜任務中的邏輯性與準確性。在知識問答、數學推理、內容創作、代碼生成、智能體(Agent) 六大核心維度,其性能已比肩國際主流頭部模型。
例如,在數學題求解中,模型不再僅輸出答案,而是展示“理解題意→拆解步驟→公式應用→驗證結果”的完整思維鏈,大幅提升可信度與可調試性。
開源開放,賦能產業生態
目前,TeleChat3系列模型權重、推理代碼及使用示例已同步上線GitHub與魔搭(ModelScope)平臺,支持學術研究與商業應用。中國電信表示,將持續推動模型在政務、通信、能源、金融等關鍵領域的落地,助力“人工智能+”行動深入行業核心。
AIbase觀察:國產大模型進入“全棧自研+能力對標”新階段
TeleChat3的發佈,不僅是一次技術成果展示,更是中國AI產業自主可控戰略的實質性落地。當千億MoE模型能在純國產算力上高效訓練,當“思考模式”逼近國際先進水平,國產大模型正從“可用”走向“好用”乃至“敢用”。
在全球AI競爭日趨“地緣化”的背景下,中國電信以TeleAI爲支點,正構建一條安全、開放、高性能的國產AI技術棧。而這條路徑的成敗,或將決定中國在未來智能時代的話語權。
項目地址:https://github.com/Tele-AI/TeleChat3
