相关推荐
瑞士科技新突破:Apertus开源模型挑战AI“黑箱”,全面公开训练细节
瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。瑞士联邦理工学院洛桑分校(EPFL)、**苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)**近日发布了一款名为 Apertus 的大规模开源语言模型。该模型不仅在名称上——拉丁语意为“开放”——彰显了其核心理念,更在实践中将“开放”做到了极致。与OpenAI的GPT系列、Meta的Llama以及Anthropic的Claude等美国主流模型不同,Apertus以其史无前例的透明度脱颖而出。它公开了从模型权重、架构、训练代码、数据配方,到完
瑞士三强联合发布开源大模型Apertus 挑战美国科技巨头
近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)联合发布了一个名为 “Apertus” 的大规模开源语言模型。该模型的名字在拉丁语中意为 “开放”,而其开发理念恰恰体现了这一精神。与当前市场上如 OpenAI 的 GPT 系列、Meta 的 Llama 和 Anthropic 的 Claude 等美国大型模型相比,Apertus 不仅注重技术本身,更以其透明度赢得了广泛的关注。这款模型的所有内容,包括模型权重、架构设计、训练代码以及数据来源等,全部实现了公开,甚
法国AI独角兽Mistral AI估值飙升至140亿美元
法国AI初创公司Mistral AI正敲定20亿欧元融资,投后估值或达140亿美元,有望成为欧洲最具价值科技初创公司之一。该公司由前DeepMind和Meta研究人员创立,被视为OpenAI主要竞争对手,专注于开发开源语言模型和欧洲用户专属AI聊天机器人Le Chat。
法国 AI 巨头 Mistral 即将获得 140 亿美元估值
法国初创公司Mistral AI即将完成20亿欧元融资,预计估值达140亿美元,成为欧洲最具价值的科技初创公司之一。该公司由前DeepMind和Meta研究人员两年前创立,专注于开发开源语言模型和面向欧洲市场的AI聊天机器人“Le Chat”。这是自2024年6月估值58亿欧元以来的首次重大融资。
IBM发布更新版Granite 3.1开源语言模型,性能大幅提升
近日,IBM 宣布推出其开源语言模型 Granite 的3.1版本,此次更新带来了诸多重要改进。新版本的模型经过重新设计,采用了更加密集的架构,能够一次处理多达128,000个令牌。这一更新意味着 Granite 在处理复杂文本和任务时的能力得到了显著增强。Granite3.1版本的模型经过了12种语言和116种编程语言的数据集训练,总共处理了12万亿个令牌。这使得模型在语言理解和生成方面的表现更加出色,能够更好地满足用户的需求。IBM 表示,这些新模型在回答使用外部数据的问题(RAG)、从非结构化文本
