小红书提出创新框架:充分利用负样本提升大语言模型推理能力

AI公司Anthropic收购Humanloop核心团队,三位创始人及十余名工程师加入。Humanloop专注AI提示管理、评估等服务,曾服务多家知名企业。此次收购聚焦人才引进,将强化Anthropic在企业市场的AI安全及工具开发能力。Anthropic近期还以低价向美政府提供AI服务,以应对OpenAI等竞争对手。Humanloop的评估技术契合Anthropic"安全第一"理念,双方合作将推动负责任AI发展。
B站测试AI视频工具"花生AI",支持文案/音频快速生成视频。提供两种创作模式:智能匹配素材(3分钟生成)和模板制作,成片质量接近UP主作品。该工具是B站AI布局的一部分,此前已推出自研大语言模型,支持10种语言实时翻译,准确率达90%。
根据毕马威中国最近发布的《首届健康科技50》报告,中国在全球医疗大模型的发布数量上占据了令人瞩目的70% 以上。这一数据不仅展现了中国在智能医疗领域的快速发展,也反映了大语言模型在医疗行业的广泛应用。报告指出,目前已经发布的医疗大模型中,大语言模型的数量占据了约65%。这类模型能够处理和生成自然语言,对于医疗数据的分析、患者交流及科研都有着重要的支持作用。而中国的表现尤为突出,其发布的医疗大模型数量不仅领先于其他国家,更是在全球市场中扮演着关
近日,南京大学的周志华教授团队发布了一项重要研究,首次理论证明了在大语言模型中可以发现内源性奖励模型,并有效应用强化学习(RL)来提升模型表现。当前,许多对齐方法依赖于人类反馈强化学习(RLHF),这种方法需要大量高质量的人类偏好数据来训练奖励模型。然而,构建这样一个数据集不仅耗时费力,还面临成本高昂的挑战。因此,研究者们开始探索替代方案,其中基于 AI 反馈的强化学习(RLAIF)受到关注。这种方法利用强大的大语言模型自身生成奖励信号,以降低对人类标
近日,字节跳动的研究与上海交通大学的团队共同推出了名为 ProtoReasoning 的新框架,旨在通过逻辑原型来增强大语言模型(LLMs)的推理能力。该框架利用结构化的原型表示,如 Prolog 和 PDDL,推动了跨领域推理的进展。近年来,大语言模型在跨领域推理方面取得了显著突破,尤其是在长链推理技术的应用下。研究发现,这些模型在处理数学、编程等任务时,表现出了在逻辑难题和创意写作等无关领域的优异能力。然而,这种灵活性背后的原因尚未完全明确。一种可能的解释是,这些模型学
6月24日,法拉第未来正式宣布推出FF AI2.0智能座舱操作系统,这是自2023年FF91发布以来最重大的智能座舱升级。新系统将通过OTA软件更新首先部署到FF912.0车型,并计划未来扩展至FX系列。FF AI2.0实现了整个AI架构的全面重构,其最大亮点是与OpenAI的深度融合。系统将大语言模型(LLMs)深度集成于法拉第未来的软件和硬件架构中,同时具备面向未来其他AI模型兼容演进的能力,为后续技术升级预留了充足空间。新系统支持超过50种语言的实时切换,具备强大的对话上下文记忆能力,能够理解和处