正文

首届大模型对抗赛即将开战谷歌、DeepSeek、Kimi等都要上

发布于AI新闻资讯

发布时间 :2025年8月5号 13:57

阅读 :1分钟

在全球 AI 研究的浪潮中，谷歌发起的首届大模型对抗赛引发了广泛关注。此次比赛将于8月5日至7日在 Kaggle Game Arena 举行，汇聚了包括 DeepSeek、Kimi 等在内的八款顶尖 AI 模型，竞争将以国际象棋为舞台，展开激烈的对抗。

此次参赛的模型包括 OpenAI 的 o4-mini、DeepSeek-R1、Kimi K2Instruct、Gemini2.5Pro（谷歌）、Claude Opus4(Anthropic)、Grok4(xAI)及 Gemini2.5Flash 等，每一款模型都代表了当前 AI 领域的最前沿技术。组织方特别邀请了世界顶级国际象棋专家进行解说，为比赛增添了专业性与观赏性。

比赛的组织方表示，这场对抗赛的初衷在于推动 AI 模型在真实对抗环境中的表现评估。随着 AI 技术的迅猛发展，现有的基准测试方法已难以有效区分模型的真实能力，Kaggle Game Arena 正是为了解决这一问题而设立的。通过在策略游戏中的实际对抗，研究者能够更全面地评估模型的表现。

比赛将采用全员对抗赛制，确保统计结果的可靠性。每对模型之间将进行多场对战，最终的排名将根据对战结果进行严格评定。为了保证透明度，比赛的执行框架和环境将全部开源，观众将能够实时查看对阵表及比赛进展。

比赛将采用单败淘汰制，每场对决包含四局，首先获得两分的模型将晋级。如果对局打成平局，双方将进行加赛决胜局。比赛过程中，每个模型将面临文本输入的挑战，无法调用外部工具如国际象棋引擎进行辅助，增加了比赛的复杂性与趣味性。

谷歌 DeepMind 联合创始人 Demis Hassabis 表示:“游戏一直是检验 AI 能力的重要试炼场。我们对 Kaggle Game Arena 能推动 AI 进步感到无比兴奋。随着更多游戏与挑战的加入，AI 的能力必将快速提升!”

随着比赛的临近，观众们对最终结果充满期待，大家热切讨论哪款模型将在这场对抗赛中脱颖而出。无论结果如何，此次比赛都将为 AI 模型的评估方法带来新的思路，并推动相关技术的不断进步。

15 亿美元和解获法官点头：Anthropic版权案落地，作家集体诉讼画上句号

美国加州联邦法官正式批准AI公司Anthropic的15亿美元和解协议，为作家指控其未经许可使用著作训练聊天机器人的集体诉讼划上句号。法官同时驳回赔偿过低异议。这起2024年提起的诉讼凸显AI训练数据版权争议，此次落槌为行业提供重要判例。

2026年7月21号 9:01

65.5k

Anthropic获批15亿美元版权和解协议，将向50万部作品支付赔偿

美国联邦法院正式批准Anthropic与作家、出版商达成的15亿美元集体诉讼和解协议。该案涉及AI模型训练侵犯版权，公司将开始支付赔偿。法官签署最终批准令，此前初步裁定Anthropic曾非法下载存储数百本书籍。

2026年7月21号 8:58

47.8k

一行GitHub代码出卖了AMD：Anthropic被曝成其新客户，算力去英伟达化加速

一行GitHub公开代码意外暴露Anthropic芯片布局。AMD AI业务高管提交的代码中，留下Anthropic将作为其客户的痕迹。行业分析机构SemiAnalysis指出，这虽非官方披露，却释放出明确信号：Anthropic正主动拓宽算力供应链，不再依赖单一芯片供应商。

2026年7月20号 16:01

214.5k

打破 15 秒魔咒：智象未来发布全球首个无限时长创作智能体vivago R1，商业可用率拉到85%

2026世界人工智能大会上，智象未来发布全球首个无限时长内容创作多模态智能体Vivago R1，并联合中科类脑等组建一带一路Token出海联盟，携手飞捷科思等发起物理智能创新联合体，以技术创新与生态协同双轮，推动AI从

2026年7月20号 14:51

203.2k

8800 万美元加注开源：Ollama跑进85%财富 500 强，喊出"全体上车"

Ollama凭借一行命令在本地运行开源大模型，让开发者摆脱API密钥与天价账单。7月9日其宣布完成8800万美元融资，由Benchmark的Peter Fenton、Theory Ventures的Tomasz Tunguz及8VC的Alex Kolicich共同领投，Docker创始人Solomon Hykes、ClickHouse CEO Aaron Katz、GIMP联合创建人兼Cockroach Labs联合创始人等参投。

2026年7月20号 13:59

183.5k

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご