2024 年值得关注的 6 大生成式 AI 趋势


Nvidia发布小型语言模型Nemotron-Nano-9B-v2,拥有9亿参数,较原版12亿大幅缩减,旨在单台A10GPU高效运行。该模型采用混合架构,适应实际部署需求,推动小型模型发展。
英伟达发布小型语言模型Nemotron-Nano-9B-V2,参数量90亿,专为高效推理设计。该模型在多项基准测试中表现优异,部分测试达到同类产品最高水平,旨在与麻省理工和谷歌的小型AI模型竞争,适用于智能手表和手机等设备。
腾讯发布多模态AI模型X-Omni,突破图像生成与理解技术瓶颈。该模型创新采用强化学习框架,整合多种评估工具,显著提升文字渲染准确率。X-Omni通过语义图像分词器实现生成与理解功能统一,在长文本渲染、图像生成和视觉理解任务中均超越主流模型。特别是不依赖分类器自由引导技术仍保持高质量输出,验证了离散自回归模型在多模态领域的潜力。该技术为AI辅助内容创作开辟了新路径。
据科技媒体 Business Insider 报道,苹果公司可能正在考虑通过一项数百亿美元的交易,来提升其在人工智能(AI)领域的竞争力。前 OpenAI 首席技术官 Mira Murati 所创立的 Thinking Machines Lab 成为了苹果的潜在收购目标,该团队汇聚了超过30名来自 OpenAI、Meta 和 Google DeepMind 的顶尖专家,专注于开发多模态 AI 模型。目前,苹果在 AI 战略上采取了一种 “平台 + 自研” 的混合模式,既为前沿 AI 产品提供 iOS 运行环境,又通过 Apple Intelligence 开发自有功能。然而,与微软和谷歌等企业级 AI 服务的竞争对
人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。该实验室声称,该模型在行业内处于领先地位。Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。Cohere 表示,他们通过 WhatsApp 免费提供 Aya Vision,希望能让世界各地的研究人员更方便地获取技术突破。Cohere 在其博客中指出,尽管人工智能已经取得了显著进展,但在不同语言之间的模型表现仍存在很大差距,尤其是在涉及文本和