正文

MiniMax 發佈國內首個 MoE 大語言模型 abab6

aibase

發布於AI新閒資訊

時間 :Jan 16, 2024

閱讀 :1分鐘

MiniMax 於 2024 年 1 月 16 日發佈了國內首個 MoE 大語言模型 abab6，該模型採用 MoE 架構，具備處理複雜任務的能力，並且在單位時間內能夠訓練更多的數據。評測結果顯示，abab6 在指令遵從、中文綜合能力和英文綜合能力上優於之前的版本 abab5.5，並超過了其他大語言模型如 GPT-3.5。abab6 展現了出色的能力，例如教授兒童數學題目和幫助構建關於上海的虛構桌遊。作爲國內首個 MoE 大語言模型，abab6 在處理複雜任務方面表現出色。

相關推薦

押注於人而非代碼：Zig 項目全面禁止 LLM 輔助貢獻引發熱議

生成式AI席捲編程領域之際，Zig開源項目逆勢推出嚴格政策：全面禁止使用大語言模型生成的代碼或評論參與貢獻。知名開發者Simon Willison解讀後，引發社區對技術效率與人才培養博弈的討論。核心矛盾在於代碼產出與人才成長的取捨，Zig維護者重新定義“貢獻”，強調原創與學習過程。

訊飛星火X2-Flash模型發佈：深耕國產算力，256K長文本能力躍升

科大訊飛發佈星火X2-Flash模型，採用MoE架構，總參數量30B，支持256K超長上下文，完全基於華爲昇騰910B集羣訓練，標誌着國產算力生態下大模型應用進入新效能階段。

Moonshot AI攜手清華大學發佈PrfaaS架構，破解大模型算力瓶頸

大語言模型推理效率迎來突破。清華大學與Moonshot AI聯合提出“預填充即服務”新架構，通過將推理過程拆分爲預填充和解碼兩個階段，並優化算力資源分配，有效解決硬件限制問題，顯著提升模型服務性能。

阿里開源 Qwen3.6-35B-A3B:30億激活參數實現編程能力跨越式升級

阿里巴巴千問團隊開源稀疏混合專家模型Qwen3.6-35B-A3B，總參數量350億，激活參數僅30億。該模型以低計算成本在多項編程基準測試中超越Qwen3.5-27B，並顯著領先前代Qwen3.5-35B-A3B，實現輕量級模型在智能體編程領域的關鍵突破。

OpenAI發佈生物學專屬大模型GPT-Rosalind，劍指科研加速

OpenAI推出生物學專用大模型GPT-Rosalind，旨在解決基因組數據過載和專業術語壁壘兩大研究痛點，與通用科學模型形成差異化競爭。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase