零一萬物公司宣佈開源Yi-9B模型,該模型是Yi系列中代碼和數學能力最強的,實際參數爲8.8B,默認上下文長度爲4K tokens。Yi-9B在綜合能力、代碼能力、數學能力方面均表現優異,超越了其他開源模型。同時,Yi-9B可以輕鬆部署在消費級顯卡上,使用成本較低,開發者友好。公司由李開復創新工場董事長兼CEO創辦,之前已推出Yi-34B和Yi-6B兩個開源大模型,對學術研究完全開放,同步免費商用申請。
相關推薦
阿里巴巴AI業務重塑 阿里巴巴大模型品牌統一爲千問
阿里巴巴整合旗下AI業務,統一命名爲“千問”,涵蓋基礎與專業模型,並明確千問APP爲消費者旗艦應用,標誌着其AI戰略進入新階段。
Mar 2, 2026
146.1k
螞蟻集團開源Ring-2.5-1T,全球首個混合線性架構萬億參數思考模型來了
螞蟻集團開源發佈全球首個萬億參數思考模型Ring-2.5-1T,在長文本生成、數學推理與智能體任務執行方面表現領先。該模型在32K以上長文本生成場景中,訪存規模降低10倍以上,生成吞吐提升3倍以上,顯著提升生成效率。
Feb 13, 2026
194.7k
智譜發佈 GLM-5:從“代碼生成”邁向“工程構建”的 Agentic Ready 時代
智譜開源全新基座模型GLM-5,實現從代碼生成到獨立完成複雜系統工程的範式轉移。該模型在權威榜單中位列全球第四、開源模型第一,性能對標頂尖水平,工程化能力卓越,使用體驗接近Claude Opus4。
Feb 12, 2026
224.9k
蘋果論文又炸場!Qwen3-Coder 被“特調”後,UI 生成能力竟超越了 GPT-5?
蘋果團隊通過改進開源模型,在UI設計領域超越頂尖大模型。傳統AI生成代碼在UI設計上表現不佳,因人類反饋強化學習過於粗糙。蘋果通過精細調整,使小模型在特定任務上實現逆襲,解決了開發者頭疼的界面開發難題。
Feb 6, 2026
805.8k
誰是誰的“老師”?Mistral CEO 稱 DeepSeek 借鑑其架構引發技術圈熱議
Mistral CEO稱中國DeepSeek-V3基於其架構,引發關於AI創新歸屬的爭議。核心圍繞稀疏混合專家模型技術是借鑑還是自主創新。
Jan 26, 2026
163.0k
