DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。
API文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。
API文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
近日,美图公司宣布其旗下 WHEE 应用即将推出一项全新的「AI 海报」功能,旨在通过人工智能技术简化海报制作流程,为用户带来高效、便捷的设计体验。在传统的海报制作过程中,用户常常需要耗费大量时间和精力去寻找灵感、搜集素材以及反复调整排版。而美图 WHEE 的「AI 海报」功能将彻底改变这一现状。用户只需简单输入一句话,即可轻松生成各种风格的海报,且该功能特别支持中文字体,满足了国内用户的个性化需求。
近日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。DeepSeek 的研究人员首先开发了 DeepSeek-R1-Zero,这是一个完全通过大规模强化学习训练的模型,没有任何监督微调的预备步骤。DeepSeek-R1-Zero 在推理基准测试中展现出卓越的性能,例如在 AIME2024考试中,其 pass@1分数从15.6% 提升至71.0%。然而,DeepSeek-R1-Zero 也存在一些问题
近日,北京月之暗面科技有限公司宣布其旗下智能助手 Kimi 迎来了重大技术升级,推出了全新的 k1.5多模态思考模型。这一模型在多模态推理和通用推理能力上达到了行业领先水平,标志着 Kimi 在人工智能领域的又一次突破性进展。
近日,浙江大学与阿里巴巴达摩院联合发布了一项引人瞩目的研究,旨在通过教学视频创建高质量的多模态教科书。这一创新的研究成果不仅为大规模语言模型(VLMs)的训练提供了新的思路,也可能改变教育资源的利用方式。随着人工智能技术的迅猛发展,VLMs 的预训练语料主要依赖图文对数据与图文交织语料。然而,当前的这些数据多来自网页,文本与图像的关联性较弱,知识密度也相对较低,无法有效支持复杂的视觉推理。为了应对这一挑战,研究团队决定从互联网上海量的教学视频
近日,中国石化正式推出了首位 “AI 数字员工”。这位虚拟助手将在全国40余座加油站进行试点,其中包括广西南宁的新阳加能站。作为我国石油石化行业的首个 AI 加油数字员工,这一创新举措旨在提升客户的自助加油体验。在加油过程中,车主只需通过加油机大屏幕与数字员工进行互动。例如,车主询问 “你好!我要加95号汽油,请问油价是多少?” 数字员工能够快速回答油价,并为客户提供加油指导。加油结束后,这位数字员工还能根据客户的需求,推荐附近的旅游景点,实现信息的多
近日,一项由奥地利复杂科学研究所(CSH)主导的研究显示,尽管大型语言模型(LLMs)在多项任务中表现优异,但在应对高级历史问题时却暴露了短板。研究团队针对三大顶尖模型进行测试,包括 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini,结果让人失望。图源备注:图片由AI生成,图片授权服务商Midjourney为了评估这些模型在历史知识上的表现,研究者们开发了一个名为 “Hist-LLM” 的基准测试工具。该工具依据 Seshat 全球历史数据库,旨在验证 AI 回答历史问题的准确性。研究结果在知名人工智