国内大模型独角兽企业阶跃星辰近日宣布完成B轮融资,总金额高达数亿美元,引发行业高度关注。本轮融资吸引了众多重量级投资方的参与,包括上海国有资本投资有限公司及其旗下基金领投,腾讯投资、五源资本、启明创投等知名机构跟投。这笔巨额资金将主要用于加速基础模型的研发,重点提升多模态和复杂推理能力,并进一步拓展C端应用市场。
国产大模型再获巨额融资!阶跃星辰B轮融资数亿美元,押注多模态与AGI

国内大模型独角兽企业阶跃星辰近日宣布完成B轮融资,总金额高达数亿美元,引发行业高度关注。本轮融资吸引了众多重量级投资方的参与,包括上海国有资本投资有限公司及其旗下基金领投,腾讯投资、五源资本、启明创投等知名机构跟投。这笔巨额资金将主要用于加速基础模型的研发,重点提升多模态和复杂推理能力,并进一步拓展C端应用市场。
近年来,随着人工智能和计算机视觉技术的迅猛发展,人与计算机之间的交互变得越来越生动和富有表现力。尤其是在动画制作领域,如何实现基于静态图像生成动态视频一直是研究的热点。近日,一项名为 “DisPose” 的新技术应运而生,它通过解耦姿态指导,实现了更加可控的人物图像动画效果。简单的说,DisPose实现了输入动作视频和参考人物,可以让参考人物实现视频里的动作。DisPose 技术的核心在于其对传统稀疏姿态信息的重构与利用。传统方法多依赖于稀疏的骨骼姿态指导,这在
近年来,从语音助手到自动驾驶技术,AI已深入到生活的方方面面。然而,AI技术的广泛应用也带来了一些潜在的风险,其中深度伪造技术引发了社会关注。深度伪造技术利用算法生成高度逼真的虚假内容,通过学习大量真实数据,生成与人物或场景极为相似的视频或图像。尽管这一技术展示了AI的强大,但也滋生了欺诈行为。例如,近期出现了冒用张文宏医生形象和声音进行直播带货的事件。伪造视频中,合成人像宣称某产品,致使超过1200件商品售出。此事引发张文宏医生和社会公众的强
随着人工智能的不断进步,创新与可持续发展之间的平衡成为了一项重要挑战。最近,OpenAI 推出了其最新的 AI 模型 o3,这是迄今为止最强大的模型。然而,除了运行这些模型的成本外,其对环境的影响也引起了广泛关注。一项研究显示,每个 o3任务大约消耗1,785千瓦时的电能,这相当于一个美国普通家庭在两个月内的用电量。根据 Salesforce 的 AI 可持续发展负责人 Boris Gamazaychikov 的分析,这一电能消耗大约对应684千克的二氧化碳当量排放,这与五箱满油的汽油的碳排放量相当。o3的高计算
用一段简单的哼唱、一段节奏的敲击,就能让AI生成一段高品质的音乐或音效,这不再是幻想。一项名为Sketch2Sound的创新研究成果,展示了一种全新的AI模型,它可以通过声音模仿和文本提示来生成高质量的音频,为声音创作领域带来了革命性的突破。Sketch2Sound的核心技术在于,它能够从任何声音模仿(如人声模仿或参考声音)中提取出三个关键的、随时间变化的控制信号:响度、亮度(频谱质心)和音高。这些控制信号被编码后,会被添加到用于文本到声音生成的潜在扩散模型中,从而引导A
Meta公司AI研究负责人Yann LeCun近日在接受采访时表示,当前的AI系统并不如一些研究人员所宣传的那样强大。他指出,人工智能的真正理解、规划和推理能力依然不足,需要多次“概念性突破”才能实现类人智能。图源备注:图片由AI生成,图片授权服务商MidjourneyLeCun批评OpenAI和Google DeepMind对AI的乐观态度过于夸大,认为人类智能AI在未来5年内显然不可能实现。LeCun提到,当前的AI更多依赖文本训练,但这种方式获取的信息十分有限。他提出,下一代AI系统需要具备情感能力,以便更好地设定目
近日,科技分析机构 SemiAnalysis 发布了一项为期五个月的调查报告,揭示了 AMD 最新推出的 MI300X AI 芯片在软件方面存在重大问题,导致其无法发挥应有的性能,因而在 AI 芯片市场中无法挑战 Nvidia 的主导地位。图源备注:图片由AI生成,图片授权服务商Midjourney报告指出,AMD 的软件存在大量漏洞,导致 AI 模型训练几乎不可能,用户需要耗费大量时间进行调试。与此同时,Nvidia 持续推出新的功能、库以及性能更新,进一步扩大了两者之间的差距。分析人员进行了大量测试,包括 GEMM 基准测试