正文

昆仑万维：多模态大模型已进入实验性训练阶段

发布于AI新闻资讯

发布时间 :2023年8月31号 16:27

阅读 :1分钟

昆仑万维表示其多模态大模型 “天工” 已进入实验性训练阶段，经过持续的迭代和高负荷的运行。手机端天工 AI 助手已上线内测，用户可进行万字以上的文本对话交互。

英伟达推出统一音频智能模型 Nemotron-Labs-Audex-30B-A3B

NVIDIA推出统一音频-文本大模型Audex，基于纯文本MoE架构，采用单一Transformer，解决多模态模型音频增强导致文本逻辑下降的难题，实现高效音频理解与文本能力的平衡。

谷歌DeepMind的文生视频模型Gemini Omni Flash在权威盲测排行榜Video Arena中以1404Elo分跃居第一，彰显谷歌多模态技术实力，也印证视频生成领域正高速迭代。

昆仑万维发布天工3.2版，推出Skywork Tags功能，针对频繁切换窗口搬运数据导致效率下降的痛点。其核心逻辑是不改变团队既有协作流程，直接将AI智能体接入Slack、飞书、钉钉、Discord、Telegram等现有办公群组，让智能体无缝融入工作场景。

商汤科技正秘密研发多模态大模型“U1Pro”，面向设计场景，由首席科学家林达华牵头。该模型隶属“日日新”家族，目标对标OpenAI的GPT-Image2，强调长程逻辑与思考能力，预计7月启动内测并商用。

昆仑万维发布天工3.1，国内外同步上线，核心升级推出画布设计Skywork Design与多Agent调度Dynamic Workflows，推动AI从演示转向高完成度产品。天工3.0上线一个月后，其超级智能体依托高粘性Websites场景实现收入三倍增长，深度用户单个项目平均交互轮数超40轮。

智启未来，您的人工智能解决方案智库