Sakana AI 是一家专注于自然启发算法的人工智能研究实验室,近日推出了一种名为 Transformer² (Transformer-squared) 的创新自适应语言模型。该模型无需昂贵的微调,即可在推理过程中动态学习并适应新任务,这标志着大型语言模型 (LLM) 技术发展的重要一步。
Sakana AI 的 Transformer² 模型突破 LLM 限制,实现动态推理

Sakana AI 是一家专注于自然启发算法的人工智能研究实验室,近日推出了一种名为 Transformer² (Transformer-squared) 的创新自适应语言模型。该模型无需昂贵的微调,即可在推理过程中动态学习并适应新任务,这标志着大型语言模型 (LLM) 技术发展的重要一步。
近日,有媒体报道,印度商业巨头穆凯什・阿班尼领导的信实集团(Reliance)正在筹备建设一个可能成为全球最大的人工智能数据中心,项目选址位于印度古吉拉特邦的贾曼加尔(Jamnagar)。该数据中心的计划容量达到3千兆瓦,这一规模远超当前最大的微软600兆瓦数据中心。图源备注:图片由AI生成,图片授权服务商Midjourney据报道,该项目的投资预算在200亿到300亿美元之间。为了推动这一庞大的项目,阿班尼在2020年成功融资超过250亿美元,吸引了包括 Meta、谷歌、银湖资本、通用大西洋、KKR、
今日,中国联通宣布,其旗下联通数据智能有限公司正式发布了元景思维链大模型。这一创新成果已在GitHub、魔搭、始智等多个社区全面开源,标志着中国联通在人工智能领域迈出了重要一步。
在全球化妆品行业日益关注可持续发展的背景下,IBM 与法国美容巨头欧莱雅宣布达成战略合作,联合开发一个专门针对化妆品行业的生成式人工智能基础模型。这一合作旨在提高欧莱雅在可持续原材料使用方面的效率,减少生产过程中的能源和材料浪费。IBM 表示,该模型将利用其先进的生成式人工智能技术,结合欧莱雅的丰富化妆品配方数据。这一系统将整合大量的配方和成分数据,帮助加速新产品的研发,优化现有产品的配方,并支持规模化生产的调整。通过这种合作,欧莱雅的约400
药物发现与开发是药理研究中的关键环节,然而目前这一过程仍然依赖大量动物实验。动物实验不仅面临伦理问题,还昂贵且耗时。为了降低这些问题的影响,德国康斯坦茨大学的帕特里克・穆勒教授及其团队正在研发一种名为 “EmbryoNet-AI” 的自动化评估方法,旨在取代传统的动物实验,极大提升药物开发的效率。穆勒教授最近获得了欧洲研究委员会(ERC)颁发的15万欧元 “概念证明” 资助,以支持其研究项目的进展。EmbryoNet 是基于其在 “ACE-OF-SPACE” 项目中的研究成果而开发的,该软
近日,深圳元象信息科技有限公司正式推出了其领先的智能数字人平台“元象日播”,为品牌展示和内容生产带来了全新的解决方案。该平台凭借其高自然度的定制能力、实时交互功能以及一键开播的便捷性,迅速吸引了众多行业的关注。
最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。这一特性使 DeepSeek 的产品受到了不少开发者的青睐。上周,该实验室发布了其 DeepSeek-R1模型的开放版本,声称在某