小红书提出创新框架:充分利用负样本提升大语言模型推理能力

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2024年1月24号 16:48

小红书搜索算法团队在AAAI2024上推出了一项旨在解决大语言模型在推理任务中黑盒属性和庞大参数量问题的创新框架。该框架专注于利用负样本知识来提升大语言模型的推理能力，提出了负向协助训练（NAT）和负向校准增强(NCE)等序列化步骤，为大语言模型应用性能提供了新思路。

Anthropic 收购 Humanloop 核心团队，增强 AI 安全与企业服务能力

AI公司Anthropic收购Humanloop核心团队，三位创始人及十余名工程师加入。Humanloop专注AI提示管理、评估等服务，曾服务多家知名企业。此次收购聚焦人才引进，将强化Anthropic在企业市场的AI安全及工具开发能力。Anthropic近期还以低价向美政府提供AI服务，以应对OpenAI等竞争对手。Humanloop的评估技术契合Anthropic"安全第一"理念，双方合作将推动负责任AI发展。

B 站测试新 AI 视频创作工具 “花生 AI”，3 分钟可成片

B站测试AI视频工具"花生AI"，支持文案/音频快速生成视频。提供两种创作模式：智能匹配素材（3分钟生成）和模板制作，成片质量接近UP主作品。该工具是B站AI布局的一部分，此前已推出自研大语言模型，支持10种语言实时翻译，准确率达90%。

中国医疗大模型发布量占全球70%！毕马威揭示未来市场潜力

根据毕马威中国最近发布的《首届健康科技50》报告，中国在全球医疗大模型的发布数量上占据了令人瞩目的70% 以上。这一数据不仅展现了中国在智能医疗领域的快速发展，也反映了大语言模型在医疗行业的广泛应用。报告指出，目前已经发布的医疗大模型中，大语言模型的数量占据了约65%。这类模型能够处理和生成自然语言，对于医疗数据的分析、患者交流及科研都有着重要的支持作用。而中国的表现尤为突出，其发布的医疗大模型数量不仅领先于其他国家，更是在全球市场中扮演着关

重大突破！研究团队揭示大语言模型内部潜藏的 “奖励机制”

近日，南京大学的周志华教授团队发布了一项重要研究，首次理论证明了在大语言模型中可以发现内源性奖励模型，并有效应用强化学习（RL）来提升模型表现。当前，许多对齐方法依赖于人类反馈强化学习（RLHF），这种方法需要大量高质量的人类偏好数据来训练奖励模型。然而，构建这样一个数据集不仅耗时费力，还面临成本高昂的挑战。因此，研究者们开始探索替代方案，其中基于 AI 反馈的强化学习(RLAIF)受到关注。这种方法利用强大的大语言模型自身生成奖励信号，以降低对人类标

字节跳动推出 ProtoReasoning 框架：提升大语言模型的逻辑推理能力

近日，字节跳动的研究与上海交通大学的团队共同推出了名为 ProtoReasoning 的新框架，旨在通过逻辑原型来增强大语言模型（LLMs）的推理能力。该框架利用结构化的原型表示，如 Prolog 和 PDDL，推动了跨领域推理的进展。近年来，大语言模型在跨领域推理方面取得了显著突破，尤其是在长链推理技术的应用下。研究发现，这些模型在处理数学、编程等任务时，表现出了在逻辑难题和创意写作等无关领域的优异能力。然而，这种灵活性背后的原因尚未完全明确。一种可能的解释是，这些模型学

法拉第未来重磅发布FF AI2.0:与OpenAI深度融合，支持50种语言智能交互

6月24日，法拉第未来正式宣布推出FF AI2.0智能座舱操作系统，这是自2023年FF91发布以来最重大的智能座舱升级。新系统将通过OTA软件更新首先部署到FF912.0车型，并计划未来扩展至FX系列。FF AI2.0实现了整个AI架构的全面重构，其最大亮点是与OpenAI的深度融合。系统将大语言模型（LLMs）深度集成于法拉第未来的软件和硬件架构中，同时具备面向未来其他AI模型兼容演进的能力，为后续技术升级预留了充足空间。新系统支持超过50种语言的实时切换，具备强大的对话上下文记忆能力，能够理解和处