介绍了HuggingFace Space上的新工具Model Memory Calculator。它可以通过输入模型名称和数据类型,来预测该模型的内存占用,误差小至0.5MB。操作简单方便,让用户不再担心GPU内存是否够用。实际推理时内存占用约比预测值多20%。该项目由开源爱好者Zach Mueller创建,可以一键测量各种大模型的内存占用。
大模型要占你多少内存?这个神器一键测量,误差低至0.5MB|免费

介绍了HuggingFace Space上的新工具Model Memory Calculator。它可以通过输入模型名称和数据类型,来预测该模型的内存占用,误差小至0.5MB。操作简单方便,让用户不再担心GPU内存是否够用。实际推理时内存占用约比预测值多20%。该项目由开源爱好者Zach Mueller创建,可以一键测量各种大模型的内存占用。
Google DeepMind发布了一项引领性的研究,中心围绕其提出的百万级专家模型——Mixture,该模型采用了革新性架构在Transformer基础上跨出重要一步。Mixture通过让从十万多个微型专家中高效快速进行稀疏检索,实现了在保持计算效率的同时释放Transformer架构潜力的目标。核心亮点在于参数效益高的专家检索机制,通过乘积密钥技术分离计算成本与参数计数,PEER架构在语言模型任务中展现出卓越性能,优于密集式FFW,粗粒度MoE和PKM层。实证结果显示,通过调整专家数量与活跃专家数量,Mixture模型性能显著提升,特别是其在降低困惑度方面的出色表现。这项技术突破性地展示了个性化和智能化能力在提升转化率和用户满意度上的潜力,对于AIGC领域具有重要影响。
Etsy,一个在线市场,最近宣布了支持艺术家的人工智能使用计划,并允许卖家在商品说明中明确AI使用情况,售卖以此工具创作的艺术品,强调艺术家的创造性决策。平台认可人工智能在创作流程中的进步,同时明确禁止出售仅基于AI提示生成的图片,认为这超越了创作界限。此政策强调,AI生成的艺术品的提示不应单独出售,旨在保持创作完整性。Etsy表示,会随对人工智能伦理与环境影响的深入理解,适时调整相关准则。
Magnific发布新PS插件,专为Photoshop用户打造,特别是专业用户。插件内置图像放大和其他功能,用户仅需从Adobe Store安装连接Magific网站。插件整合进Photoshop菜单,使用体验流畅,支持Adobe CC管理。显著优点在于无缝切换的账户登录系统,智能对象低下创建的升级功能,保持图像原始尺寸的同时提供更多编辑空间。这一创新插件透气简化图像处理流程,提升工作效率,并提供更出色的用户体验,是PS用户不可或缺的工具。
近日,智能戒指领域的先驱者Oura公司通过其官方博客宣布,"Oura Advisor"功能现已在公司应用程序的Oura Labs预览功能中推出。这一功能被描述为"个人健康教练",本质上是一个能够为用户提供短期和长期健康建议的AI聊天机器人。
DeepMind团队最近发布了一项突破性的研究成果,针对人工智能领域长期存在的算力与时间限制问题提供了创新解决方案-名为JEST的全新数据筛选方法。JEST通过智能筛选最佳数据批次,而不是单个样本,大幅提高了训练效率,将AI训练时间缩短13倍,算力需求降低90%。这种策略在多模态学习中尤为有效,与传统方法相比,不仅减少了迭代次数和浮点运算次数,而且只需10%的FLOP预算就能超越最先进水平。JEST的核心原理在于通过在线模型近似技术和评估数据点的可学习性,选择相对容易学习的数据点作为训练素材,以此提高训练效率和效果。此外,通过使用基于阻塞吉布斯采样的迭代方法构建数据批次,JEST在处理大量数据时性能持续优化。此项工作不仅为AI训练领域带来了革命性的飞跃,为未来人工智能的发展提供了新的思路和方法论,有望开启人工智能更广阔的应用前景。
"心流"的官网展示了这款产品的多项功能。在学术研究领域,阅读和分析长篇论文是一项基础而关键的工作。为此,"心流"构建了一个包含千亿级知识点的专业知识图谱,能够从海量信息中进行深度学习,并通过图谱进行知识推理,以高效解答用户的各种复杂问题。