Colossal-AI 團隊通過低成本構建了中文版的 LLaMA-2 大模型,在多個評測榜單中取得了優異的成績。他們開源了完整的訓練流程、代碼及權重,並提供了評估體系框架 ColossalEval。這一方案可用於構建任意垂類領域的大模型,爲 AI 應用帶來了更多的可能性。
相關推薦
阿里雲大模型價格腰斬!通義千問3-Max調用費直降50%,緩存命中僅收10%費用
阿里雲百鍊宣佈自2025年11月13日起,通義千問3-Max模型核心調用費用減半,並優化緩存計費策略,大幅降低企業AI應用成本。此舉旨在降低大模型使用門檻,加速中小企業數字化轉型。
Nov 14, 2025
147.0k
字節跳動大模型研究員因泄密被開除!曾頻繁在知乎曝光機器人研發細節,公司重拳整治信息安全
字節跳動大模型團隊研究員任某某因多次泄露公司保密信息被辭退。他在知乎擁有8萬粉絲,曾頻繁發佈內部研發細節,引發關注並導致公司紀律審查。高調分享最終釀成職業危機。
Nov 13, 2025
162.9k
微博推出 VibeThinker-1.5B,低成本 AI 模型挑戰大型語言模型
微博AI部門推出開源大模型VibeThinker-1.5B,擁有15億參數。該模型基於阿里Qwen2.5-Math-1.5B優化,在數學和代碼任務表現優異。現已在Hugging Face等平臺免費開放,遵循MIT許可證,支持商業使用。
Nov 13, 2025
187.3k
GPT-5.1正式發佈!不光更聰明,還會“共情”:新增6種人格風格,AI首次納入情感依賴安全評估
OpenAI發佈GPT-5.1,標誌AI競賽進入"情商融合"新階段。模型重點強化情緒價值、個性化交互與人性化表達,解決用戶反饋的"AI冰冷"問題。採用雙模型架構:Instant模式快速響應,Thinking模式深度思考。全球分批推送中,付費用戶3個月內可繼續使用GPT-5過渡。
Nov 13, 2025
193.8k
月之暗面開源AI代理新框架Kosong!異步編排+插件化設計,開發者自由度拉滿
月之暗面開源AI代理框架Kosong,以輕量靈活特性助力下一代智能體開發。該框架通過統一抽象層解決工具碎片化問題,簡化開發流程,旨在打通大模型與實際應用場景,引發開發者社區廣泛關注。
Nov 11, 2025
140.6k
