话说最近的科技圈,AI的战火那是烧得正旺,各路豪杰纷纷亮出自己的看家本领。而曾经被认为有些“落后”的谷歌,最近却突然发力,一连串的“王炸”级新品,让投资者们眼前一亮,惊呼: “AI界,又要变天了!”
谷歌向投资者保证人工智能本月将迎来“惊人”表现

话说最近的科技圈,AI的战火那是烧得正旺,各路豪杰纷纷亮出自己的看家本领。而曾经被认为有些“落后”的谷歌,最近却突然发力,一连串的“王炸”级新品,让投资者们眼前一亮,惊呼: “AI界,又要变天了!”
国内大模型独角兽企业阶跃星辰近日宣布完成B轮融资,总金额高达数亿美元,引发行业高度关注。本轮融资吸引了众多重量级投资方的参与,包括上海国有资本投资有限公司及其旗下基金领投,腾讯投资、五源资本、启明创投等知名机构跟投。这笔巨额资金将主要用于加速基础模型的研发,重点提升多模态和复杂推理能力,并进一步拓展C端应用市场。阶跃星辰的CEO姜大昕表示,公司的发展路线与OpenAI的“ChatGPT到Sora”路径类似,都是致力于从单模态到多模态,再到实现多模理解和生成的统
一场意外的人事变动,让OpenAI首席产品官Kevin Weil临时登上了旧金山万豪酒店的演讲台。这位曾在Twitter和Instagram创造商业奇迹的硅谷产品大师,如今肩负着OpenAI商业化转型的重任。而就在几天前,公司CTO Mira Murati的突然离职,再次将OpenAI置于风口浪尖。这起高管变动并非偶然。过去一年,OpenAI经历了一波又一波的人才流失,包括CTO、AGI就绪主管以及Sora视频生成模型的联合负责人等重量级人物相继离职。这背后折射出公司内部长期存在的理念之争:是坚持非营利性质的AI实验室初心,还是转向
有“AI教母”之称的斯坦福大学教授李飞飞及其团队近日发布了一项关于多模态大模型“空间智能”的研究,揭示这些模型在记忆和回忆空间方面已经具备初步能力,并展现出形成局部世界模型的潜力。研究团队开发了用于评估视觉空间智能能力的工具——VSI-Bench,其中包含超过5000个基于288个真实视频的高质量问答对。测试视频涵盖居住空间、专业场所及工业场景,涉及多个地理区域。研究结果显示,尽管多模态模型的总体表现尚低于人类,但在某些任务上已达到或接近人类水平。例如,
国内科技企业闪极上周四推出了其首款AI拍拍镜,这款产品标志着国内AI拍摄眼镜领域的一个重要里程碑。这款眼镜的售价为1499元,而首批5万台共创版以999元的优惠价格出售,官方宣称这一价格甚至低于小米的同类产品。此外,闪极还推出了一项特别的促销活动,即用户在300天内打卡200天(无需连续)即可获得全额退款,这一策略无疑增加了产品的吸引力。
近日,来自多伦多大学及向量研究所的研究团队发布了 CAP4D 模型,这是一种基于形变多视角扩散模型(MMDM)的新技术,能够通过任意数量的参考图像生成逼真的4D 头像。该模型采用双阶段方法,首先利用 MMDM 生成不同视角和表情的图像,然后将这些生成的图像与参考图像结合,重建出一个可实时控制的4D 头像。在 CAP4D 的工作流程中,用户可以输入任意数量的参考图像,这些图像将被编码到变分自编码器的潜在空间中。接着,使用现成的面部追踪技术 FlowFace 估计每张参考图像的3D 形变模型
随着数字艺术的发展,自动化的图像处理技术日益受到关注。近日,来自清华大学与腾讯 ARC 实验室的研究团队提出了一种名为 ColorFlow 的新型图像序列上色模型。这一模型旨在解决在黑白图像序列上色的同时,保持角色和物体身份一致性的问题,满足漫画和动画等行业的实际需求。ColorFlow 是一个三阶段的扩散基础框架,它充分利用上下文信息,通过参考图像池为黑白图像序列准确生成颜色。例如,该模型能够有效地为角色的发色和服装上色,确保与参考图像的色彩一致性。与以往需要针