AIbase报道 - 苹果研究团队在最新发布的论文《UICoder:通过自动反馈微调大型语言模型生成用户界面代码》中,展示了一项令人瞩目的技术突破:成功训练开源模型自主学习SwiftUI用户界面开发。

尽管大型语言模型在创意写作和编程领域表现出色,但在生成"语法正确、设计良好的UI代码"方面仍存在明显短板。研究团队指出,即使在精心策划的数据集中,UI代码示例极为稀缺,在某些代码数据集中占比不足1%。

QQ20250815-102239.png

研究团队以开源编程模型StarChat-Beta为基础,采用独特的自动反馈循环方法:数据生成:向模型提供UI描述列表,指示其生成大量SwiftUI程序合成数据集质量筛选:通过Swift编译器验证代码可执行性,利用GPT-4V视觉模型对比界面与原始描述迭代优化:剔除编译失败、无关或重复的输出,保留高质量训练数据进行模型微调。

QQ20250815-102247.png

经过五轮迭代,团队获得了包含996,000个SwiftUI程序的庞大数据集,并成功训练出UICoder模型。

测试结果显示,UICoder在自动化指标和人工评估方面均显著超越基础StarChat-Beta模型,在整体质量上接近GPT-4水平,编译成功率甚至超越GPT-4。

QQ20250815-102255.png

研究中的一个重要发现源于数据分析:StarChat-Beta的原始训练数据几乎不包含SwiftUI内容。在创建TheStack数据集时,Swift代码库被意外排除,OpenAssistant-Guanaco数据集中仅有万分之一的Swift代码示例。

这一发现证明UICoder的性能提升并非来自重新整理已有数据,而是通过自动反馈循环构建的自生成精选数据集实现的真正学习突破。

QQ20250815-102309.png

研究团队表示,这种方法的成功验证了其在其他编程语言和UI工具包中的应用潜力,为AI辅助软件开发开辟了新的可能性。

论文地址:https://arxiv.org/html/2406.07739v1