相关推荐
揭开MiniMax M2的神秘面纱:为何选择全注意力机制?
MiniMax M2模型采用全注意力机制,放弃线性或稀疏注意力技术。开发团队认为,尽管后者能节省计算资源,但全注意力在工业应用中更高效,能提升模型性能。这一决策旨在优化实际部署效果,推动AI技术发展。
2025年11月6号 16:01
142.4k
Meta 研究人员揭开大语言模型黑箱,修复 AI 推理缺陷
Meta与爱丁堡大学合作开发CRV技术,通过分析大型语言模型内部推理电路,预测其推理正确性并修复错误。该方法构建模型激活计算图,高精度检测推理错误,提升AI可靠性。
2025年10月31号 8:57
146.0k
AI 模型用两本书生成名家风格作品,引发版权法新讨论
AI仅用两本书微调即可模仿名家写作风格,读者评价甚至超越专业模仿者。研究涉及50位知名作家,包括韩江和鲁西迪。159名参与者(含28名专家)通过Prolific平台评判,结果显示AI生成作品更受青睐。
2025年10月27号 9:37
124.6k
应对模型推理缺陷:苹果MIND团队加紧招聘AI人才
苹果公司正加紧招聘推理模型领域专家,以解决其研究揭示的大型语言模型重大缺陷。招聘聚焦开发更准确高效的新型架构,重点强化推理、规划、工具使用和基于代理的LLM能力。
2025年10月23号 9:00
102.9k
AI 驱动的“数字孪生”解放工作效率:初创公司 Viven 获3500万美元种子轮融资,解决员工“不在场”痛点
人工智能初创公司Viven利用大型语言模型和数据隐私技术,打造员工数字孪生,解决因休假或时区差异导致的关键信息缺失问题,避免项目停滞,降低时间成本。
2025年10月16号 9:13
156.3k
