相关推荐
字节开源全新代码大模型评估基准“FullStack Bench”
12月5日,字节豆包大模型团队推出了最新的代码大模型评估基准——FullStack Bench,涵盖了超11类真实场景,支持16种编程语言,并包含3374个问题。这一基准相比之前的评估标准,在更广泛的编程领域中能更准确地评估大模型的代码开发能力,推动了模型在现实世界编程任务中的优化。目前的主流代码评估基准,如HumanEval和MBPP,通常集中在基础和高级编程问题,而DS-1000则专注于数据分析和机器学习任务,且仅支持Python。xCodeEval则侧重于高级编程和数学领域,存在较大的应用场景和语言覆盖限
DeepSeek 发布开源代码大模型 DeepSeek Coder
["DeepSeek(深度求索)发布了开源代码大模型 DeepSeek Coder","DeepSeek Coder 是一个智能代码助手,可以生成各种代码","DeepSeek Coder 已经在 Hugging Face 和 GitHub 上开源","DeepSeek Coder 在国际权威数据集的测试中表现出色","DeepSeek 致力于探索 AGI 的本质,将推出更多研究成果"]
国风漫剧迈入 AI 时代!横店影视《九州牧云录》今日上线,开启东方美学“智”造新范式
国产影视巨头横店影视进军AI短剧赛道,推出国风漫剧《九州牧云录》。该剧改编自管平潮同名小说,以九州大陆为背景,讲述少年冒险故事,是“AI+影视”工业化的重要尝试,旨在通过AI技术赋能经典IP,实现东方美学的创新呈现。
毕业生就业“寒冬”?普华永道英国岗位申请量暴增 35%
尽管AI裁员与经济不确定性笼罩全球职场,传统顶级会计师事务所的吸引力却逆势攀升。普华永道英国分所毕业生岗位申请量较去年激增35%,反映出当前就业市场趋势:在初创企业和科技巨头频繁调整招聘计划的背景下,提供成熟培训体系的“四大”机构成为毕业生眼中的“职业安全港”。
白领“裁员潮”将至?华尔街正在搜寻下一个受 AI 威胁的职业
华尔街投资者正从AI硬件红利转向关注其带来的“生存危机”,金融界开始排查可能因AI普及而衰退的行业。目前,AI已对初级分析师、数据录入员等职业产生替代作用。分析师指出,涉及大量数据处理和基础逻辑归纳的岗位均面临风险。
