昆仑万维发布轻量级多模态智能体 Skywork R1V4-Lite，开启智能交互新纪元

昆仑万维正式推出 Skywork R1V4-Lite，这是一款集成视觉操作、推理与规划能力的轻量级多模态智能体。与传统模型不同，Skywork R1V4-Lite 不仅具备深度推理能力，还能够主动进行图像操作、外部工具调用和多模态深度研究，使其在复杂场景中的应用更加灵活。

用户只需拍一张照片，Skywork R1V4-Lite 便可快速完成任务，自动判断空间位置、放大模糊文字、绘制辅助线等。这款智能体的设计让人们不再需要复杂的提示词，只需简单的视觉输入，系统就能自我推理并给出解决方案。这一特性使得多模态智能体从封闭推理向开放交互的转变成为可能。

Skywork R1V4-Lite 在多个权威基准测试中表现出色，尤其在多模态理解任务上超过 Gemini2.5Flash，展现了其极强的竞争力。其主动图像操作能力让模型在面对信息不足或视角受限的场景时，能够自动裁剪、放大和旋转图像，构建出清晰可回溯的 “视觉行动链”。

此外，Skywork R1V4-Lite 还支持联网搜索，能够在执行任务时触发深度研究，通过与外部资源交互，提升推理的深度和广度。这种跨模态的知识扩展能力，使得其在学术、法律、生态以及电商等多个领域展现出广泛应用潜力。

最令人期待的是，Skywork R1V4-Lite 还具备主动式任务规划能力，能够基于视觉输入生成可执行的任务链。这意味着，用户不仅可以得到回答，更可以通过智能体制定出详细的行动计划，为各种场景提供精准的解决方案。

Skywork R1V4-Lite Github地址:

https://github.com/SkyworkAI/Skywork-R1V

划重点:
🌟 Skywork R1V4-Lite 是一款轻量级多模态智能体，具备视觉操作、推理与规划三大能力。
📸 用户只需拍一张图，系统便可自动完成复杂任务，提升操作便利性。
🔍 该智能体在多模态理解基准测试中表现优异，展现出强大的跨模态推理与知识扩展能力。

Runway推出Media Router：自动切换AI模型帮你省Token，创意验证到成片一条龙搞定

Runway推出Media Router，可依据质量、速度与成本优先级，为图像、视频、音频生成自动切换AI模型。系统将调用场景分为三类，如高速生成模式用于快速创意验证，实现智能匹配，省去开发者逐一比较和手动切换的负担，兼顾效率与成本。

小鹏人形机器人广州工厂开启小批量试生产预计2026年实现量产

近日，小鹏人形机器人在广州工厂正式开启小批量试生产，量产产线已进入最后联调，标志着量产冲刺进入倒计时。集团董事长何小鹏已亲自兼任机器人业务CEO，全面统筹并推进商业化落地进程。按照内部机器人量产动员大会规划，公司将于2026年正式实现人形机器人量产，并计划

Kimi K3 攻防考卷翻车：漏洞利用只到美国前沿模型四成，蒸馏疑云被安全机构摆上台