相关推荐
大模型新玩法!腾讯优图与上交大联手 利用公开知识提升大模型
腾讯优图实验室与上海交通大学的研究团队联手推出了一项革命性的知识增强方法,为大模型优化开辟了全新道路。这项创新技术摒弃了传统模型微调的局限,直接从开源数据中提取知识,大幅简化了模型优化流程,在多项任务中实现了超越现有最先进技术(SOTA)的卓越表现。近年来,大型语言模型(LLMs)虽然在各领域取得了显著进展,但在实际应用中仍面临着诸多挑战。传统的模型微调方法需要大量标注数据和计算资源,这对许多实际业务而言往往难以实现。尽管开源社区提供了丰富
2024年9月29号 10:37
202.2k
昆仑万维发布 “4+3 战略”:从技术底座到商业闭环
昆仑万维2025年报显示,公司营收81.98亿元,同比增长44.78%,海外收入77.23亿元,增长49.91%。公司推出“4+3战略”,明确了AI驱动内容生产的发展方向,涵盖技术与商业布局。
2026年4月24号 11:29
27.4k
OpenAI与Anthropic的阴影:Cursor500亿美元融资为何遭大厂投资者拒绝
AI编程公司Cursor寻求数十亿美元融资遇阻,其500亿美元估值让多家后期投资机构却步。此前SpaceX曾有意以600亿美元收购,但包括Iconiq在内的顶级基金已明确拒绝。融资遇冷主因是全球资本在AI领域已完成初期布局。
2026年4月24号 11:22
79.6k
DeepSeek-V4预览版正式发布:1M 超长上下文进入全员普惠时代
深度求索(DeepSeek)发布DeepSeek-V4预览版并开源,实现1M超长上下文标准化,在Agent协作、知识及推理性能上领先国内及开源领域。双版本布局:Pro版(1.6T参数,激活49B)性能对标顶级闭源模型,Flash版兼顾效率,满足不同应用需求。
2026年4月24号 11:05
176.0k
DeepSeek V4 正式发布,DeepSeek-V4-Flash与 DeepSeek-V4-Pro双版本定价揭晓
DeepSeek发布新一代旗舰模型V4,采用细分化策略推出Flash与Pro两个版本,分别覆盖轻量高频应用和复杂推理任务。此举不仅满足不同场景需求,还以极具竞争力的定价重塑AI商业化基准,整合了原有deepseek-chat与deepseek-reasoner模型。
2026年4月24号 11:04
153.6k
