「小さなモデルでは大巨人に勝てない」と誰が言えたでしょうか?最近、アップルUICoderチームはAI界を震撼させた最新の研究論文を公開し、オープンソースモデルを「魔改(改造)」することで特定の分野でトップクラスの大モデルを打ち負かすことができることを示しました。

今回は、すべての開発者にとって悩みの種であるUI(インターフェース)開発に注目しています。

現在、AIによるコード生成は非常に優れていますが、UIデザインにおいてはあまり良い成果を出していません。その理由は簡単です。「人間のフィードバックを用いた強化学習(RLHF)」は従来の方法では粗いものだったのです。これまでAIがデザインを学ぶ際には、デザイナーが「このインターフェースは良くない」と言うだけでしたが、AIはなぜ良くないのか、どう直すべきなのかが分かりませんでした。

「審美性がある」AIを育てるために、アップルは21人のベテランの外部スタッフを招きました。

これらの2〜30年以上の経験を持つデザイナーたちが単なるスコア付けだけでなく、実際に行動に移しました。コメントを書き、スケッチを描き、コードを修正しました。アップルチームは、このような深い論理を備えた専門家のコメントを1460件収集し、それにもとづいて特別な報酬モデルを作成しました。

驚くべき結果が得られました:微調整されたQwen3-CoderがGPT-5を破りました。

実験データによると、わずか181個の高品質な「スケッチフィードバック」のみで微調整したこのモデルは、パラメータ数がそれほど大きくないにもかかわらず、アプリのインターフェースを生成する能力においてGPT-5を上回りました。これはAIトレーニングにおいて、専門的な「少量で質の高い」フィードバックが大量の一般データよりもはるかに効果的であることを再確認するものです。

研究はまた、ある真実を鋭く明らかにしました:審美は本当に主観的です。

研究の結果、一般人とプロのデザイナーがインターフェースの良さを判断する際に一致する確率はなんと49.2%であり、コインを投げるのと同じくらいでした。しかし、デザイナーが「スケッチ」を通じて具体的な修正意図を表現すると、一致率は一気に76.1%に上昇します。これは、将来的なAIデザインツールがあなたの好みを盲目に推測するのではなく、あなたの視覚的な言語を本物のように理解できるようになることを意味しています。

もしアップルがこの技術をXcodeに実際に組み込むことができれば、「一言で美しいアプリを生成する」時代はもう遠くありません。