苹果研究团队突破AI编程瓶颈:让开源模型自学SwiftUI界面开发

AIbase报道 - 苹果研究团队在最新发布的论文《UICoder:通过自动反馈微调大型语言模型生成用户界面代码》中，展示了一项令人瞩目的技术突破:成功训练开源模型自主学习SwiftUI用户界面开发。

尽管大型语言模型在创意写作和编程领域表现出色，但在生成"语法正确、设计良好的UI代码"方面仍存在明显短板。研究团队指出，即使在精心策划的数据集中，UI代码示例极为稀缺，在某些代码数据集中占比不足1%。

研究团队以开源编程模型StarChat-Beta为基础，采用独特的自动反馈循环方法:数据生成:向模型提供UI描述列表，指示其生成大量SwiftUI程序合成数据集质量筛选:通过Swift编译器验证代码可执行性，利用GPT-4V视觉模型对比界面与原始描述迭代优化:剔除编译失败、无关或重复的输出，保留高质量训练数据进行模型微调。

经过五轮迭代，团队获得了包含996，000个SwiftUI程序的庞大数据集，并成功训练出UICoder模型。

测试结果显示，UICoder在自动化指标和人工评估方面均显著超越基础StarChat-Beta模型，在整体质量上接近GPT-4水平，编译成功率甚至超越GPT-4。

研究中的一个重要发现源于数据分析:StarChat-Beta的原始训练数据几乎不包含SwiftUI内容。在创建TheStack数据集时，Swift代码库被意外排除，OpenAssistant-Guanaco数据集中仅有万分之一的Swift代码示例。

这一发现证明UICoder的性能提升并非来自重新整理已有数据，而是通过自动反馈循环构建的自生成精选数据集实现的真正学习突破。

研究团队表示，这种方法的成功验证了其在其他编程语言和UI工具包中的应用潜力，为AI辅助软件开发开辟了新的可能性。

论文地址:https://arxiv.org/html/2406.07739v1

打破专用模型桎梏！谷歌 DeepMind 发布 GenCeption，一个 AI 搞定五大视觉任务

谷歌DeepMind推出GenCeption模型，将视频生成AI逆向改造为视觉分析引擎，单一模型即可同时完成深度估计、图像分割、3D姿态估计等五项核心视觉任务。模型基于阿里通义万相Wan2.1框架训练，一次前向传播实现预测，打破任务孤立格局。

Anthropic Fable 5 训练成本三倍于开源模型，未来面临挑战

Wojciech Gryc 分析指出，Anthropic 的 Fable 5 面临来自中国开源模型的市场竞争：Moonshot 的 Kimi K3 和阿里 Qwen 3.8 性能与之相当，且都将开源权重。他强调，虽然训练前沿模型的主要成本是研究人员与算力，但模型训练完成后，推理成本才是真正的开支；每次调用 API 消耗大量 GPU 资源，这才是持续的商业负担。

苹果研究团队突破AI编程瓶颈:让开源模型自学SwiftUI界面开发

相关推荐

打破专用模型桎梏！谷歌 DeepMind 发布 GenCeption，一个 AI 搞定五大视觉任务

消息称智元机器人据悉冲刺IPO，目标估值200亿美元

美国大模型抄了DeepSeek作业：性能没赢、价格更贵，却精准卡住了美国企业的合规刚需

日本Sakana AI放出Fugu Cyber：一个多智能体系统，把GPT-5.5-Cyber和Claude都挑落马下

Anthropic Fable 5 训练成本三倍于开源模型，未来面临挑战

苹果研究团队突破AI编程瓶颈:让开源模型自学SwiftUI界面开发

相关推荐

​打破专用模型桎梏！谷歌 DeepMind 发布 GenCeption，一个 AI 搞定五大视觉任务

消息称智元机器人据悉冲刺IPO，目标估值200亿美元

美国大模型抄了DeepSeek作业：性能没赢、价格更贵，却精准卡住了美国企业的合规刚需

日本Sakana AI放出Fugu Cyber：一个多智能体系统，把GPT-5.5-Cyber和Claude都挑落马下

Anthropic Fable 5 训练成本三倍于开源模型，未来面临挑战

打破专用模型桎梏！谷歌 DeepMind 发布 GenCeption，一个 AI 搞定五大视觉任务