中国科学技術大学および国内の複数の大学の研究チームは、最近、「UniCorn」という新しい技術フレームワークを発表しました。このフレームワークの核心的な目的は、自動画像処理システムに特別な能力を与えること、つまり、生成するコンテンツにおける自身の欠点を認識し修正する能力です。
研究者らは、現在の画像認識および生成システムが複雑な視覚情報を理解することはできるものの、それを具体的な画像に変換する際には、認知と表現の不一致が生じることが多いと発見しました。例えば、あるシステムはサンプル画像において「左側が砂浜で右側が波」であることを正確に判断できますが、独自に新しい画像を生成する際には、空間順序が逆転するような低級なエラーが頻繁に発生します。

中国の研究者は、このような「理解できるが正しく説明できない」現象を、医学分野における「伝導性失語症(アグラフィア)」にたとえています。これは、言葉を理解はできるが、正しい言い換えができなくなる神経系の疾患です。この認知のギャップを埋めるために、UniCornフレームワークは革新的な協働メカニズムを導入しています。
UniCornのコアな考え方は、システムが画像品質を評価する能力が、ゼロから画像を構築する能力よりも通常優れているという点にあります。したがって、このような「美的評価」基準が生成プロセスを逆に指導すべきです。そのため、研究者らは同じ運行空間内でシステムを3つの補完的な役割に分け、観察者、実行者、品質検査員の役割を同時に担わせました。
