「小さなモデルでは大巨人に勝てない」と誰が言えたでしょうか?最近、
今回は、すべての開発者にとって悩みの種であるUI(インターフェース)開発に注目しています。
現在、AIによるコード生成は非常に優れていますが、UIデザインにおいてはあまり良い成果を出していません。その理由は簡単です。「人間のフィードバックを用いた強化学習(RLHF)」は従来の方法では粗いものだったのです。これまでAIがデザインを学ぶ際には、デザイナーが「このインターフェースは良くない」と言うだけでしたが、AIはなぜ良くないのか、どう直すべきなのかが分かりませんでした。
「審美性がある」AIを育てるために、アップルは21人のベテランの外部スタッフを招きました。
これらの2〜30年以上の経験を持つデザイナーたちが単なるスコア付けだけでなく、実際に行動に移しました。コメントを書き、スケッチを描き、コードを修正しました。
驚くべき結果が得られました:微調整されたQwen3-CoderがGPT-5を破りました。
実験データによると、わずか181個の高品質な「スケッチフィードバック」のみで微調整したこのモデルは、パラメータ数がそれほど大きくないにもかかわらず、アプリのインターフェースを生成する能力において
研究はまた、ある真実を鋭く明らかにしました:審美は本当に主観的です。
研究の結果、一般人とプロのデザイナーがインターフェースの良さを判断する際に一致する確率はなんと49.2%であり、コインを投げるのと同じくらいでした。しかし、デザイナーが「スケッチ」を通じて具体的な修正意図を表現すると、一致率は一気に76.1%に上昇します。これは、将来的なAIデザインツールがあなたの好みを盲目に推測するのではなく、あなたの視覚的な言語を本物のように理解できるようになることを意味しています。
もし
