AIbase報道 - 蘋果研究團隊在最新發佈的論文《UICoder:通過自動反饋微調大型語言模型生成用戶界面代碼》中,展示了一項令人矚目的技術突破:成功訓練開源模型自主學習SwiftUI用戶界面開發。
儘管大型語言模型在創意寫作和編程領域表現出色,但在生成"語法正確、設計良好的UI代碼"方面仍存在明顯短板。研究團隊指出,即使在精心策劃的數據集中,UI代碼示例極爲稀缺,在某些代碼數據集中佔比不足1%。
研究團隊以開源編程模型StarChat-Beta爲基礎,採用獨特的自動反饋循環方法:數據生成:向模型提供UI描述列表,指示其生成大量SwiftUI程序合成數據集質量篩選:通過Swift編譯器驗證代碼可執行性,利用GPT-4V視覺模型對比界面與原始描述迭代優化:剔除編譯失敗、無關或重複的輸出,保留高質量訓練數據進行模型微調。
經過五輪迭代,團隊獲得了包含996,000個SwiftUI程序的龐大數據集,併成功訓練出UICoder模型。
測試結果顯示,UICoder在自動化指標和人工評估方面均顯著超越基礎StarChat-Beta模型,在整體質量上接近GPT-4水平,編譯成功率甚至超越GPT-4。
研究中的一個重要發現源於數據分析:StarChat-Beta的原始訓練數據幾乎不包含SwiftUI內容。在創建TheStack數據集時,Swift代碼庫被意外排除,OpenAssistant-Guanaco數據集中僅有萬分之一的Swift代碼示例。
這一發現證明UICoder的性能提升並非來自重新整理已有數據,而是通過自動反饋循環構建的自生成精選數據集實現的真正學習突破。
研究團隊表示,這種方法的成功驗證了其在其他編程語言和UI工具包中的應用潛力,爲AI輔助軟件開發開闢了新的可能性。
論文地址:https://arxiv.org/html/2406.07739v1