アップル社は最近、「拡張現実ビデオの適応的量子化行列」という名称の特許技術を申請しました。この技術は、インテリジェントなパーティションと差別化されたエンコードを通じて、XR(拡張現実)ビデオの送信効率を大幅に最適化することを目指しています。この革新的な技術は、AR/VRシナリオにおける仮想と現実が融合した映像のリアルタイム伝送に革命的な進展をもたらす可能性があります。
この特許の核心は、XR映像を「虚領域」(仮想オブジェクトを含む領域)と「背景領域」(現実部分)の2つの主要領域に知能的に分割することにあります。これらの領域の重要性に基づき、アップルは細分化された3段階の量子化戦略を採用しています:
- 高精度の仮想オブジェクトエンコード: 「虚領域」には、高精度なエンコード方法が使用され、量子化パラメーター(QP値)を通常より30%低減することで、仮想要素の鮮明さと詳細表現を確保します。
- ユーザーの注視領域の最適化: さらに、ユーザーが現在注視している領域には、追加で15%のビットレートを割り当て、ユーザーの注目点の視覚体験を最適化します。
- 効率的な背景領域圧縮: 相対的に重要な背景領域には、圧縮率が高いエンコード方法を使用し、全体的なデータ量を効果的に削減します。
テストデータによると、このソリューションを採用することで、重要な領域(仮想オブジェクトやユーザーの注視点)の画質を維持しながら、全体のビットレートを最大40%まで削減できます。これは、AR/VRコンテンツのリアルタイム伝送において高帯域幅要件に対応する上で非常に重要であり、ネットワーク遅延と帯域幅消費を大幅に減少させ、ユーザーエクスペリエンスを向上させることが期待されます。
さらに、この特許では、映像の複雑さに応じて自動的にブロックサイズを調整する動的パーティションアルゴリズムも提案されています。複雑な領域では、最小で4×4ピクセルブロックまで細分化され、極端な詳細も十分に保持されます。
この特許技術の導入により、アップルがXR分野での取り組みに対する強い意欲が再び示され、将来的なAR/VRデバイス向けにより効率的でスムーズな視覚伝送ソリューションを提供することが期待されています。