拡張現実(AR)グラスの分野において、雷鳥创新は革命をリードしています。AI技術の急速な発展に伴い、ARグラスは未来の消費電子機器の重要な担い手として認識されつつあります。雷鳥创新と阿里雲の深い協力関係は、AIとARのシームレスな融合を目指し、ユーザーによりスムーズなインタラクション体験を提供することに注力しています。
過去、ARグラスはデジタル世界と物理世界を提示することはできましたが、両者間の効果的なインタラクションは不足していました。しかし現在、AI大規模言語モデルの進歩により、ARグラスは視覚情報を提示するだけでなく、AI技術を用いてユーザーの周囲環境をリアルタイムで分析・理解できるようになりました。この組み合わせは、ユーザーにより豊かなアプリケーションシナリオを提供し、特に生活アシスタントなどの分野において、利便性と正確性を向上させています。
画像出典:画像はAIによって生成され、画像ライセンスサービスプロバイダーMidjourneyによって提供されています。
雷鳥创新の創設者兼CEOである李宏偉氏は、ARグラスが人間にAIと高度に一致した感覚能力を提供し、それによってAIが真に人間の「外脳」になるだろうと指摘しています。同氏は、今後2~3年以内にAIがARグラスを最も重要な新型ハードウェアへと押し上げ、「次のiPhone」を生み出すと確信しています。
しかし、大規模言語モデルの汎用的な能力だけに頼って多様なシナリオでのインタラクションを実現するには不十分です。雷鳥と通義の協業は、特定のニーズを満たすためにARグラス向けに大規模言語モデルをカスタマイズすることに重点を置いています。李宏偉氏は、ARグラスのユーザーエクスペリエンスには十分な正確性と確実性が必要であり、そうでなければユーザーは受け入れにくいと強調しています。例えば、道路標識の認識精度が50%しかなかった場合、ユーザーは不安を感じるでしょう。
この目標を実現するために、雷鳥は通義の大規模言語モデルを選択しました。これは、画像、テキスト、ビデオ、オーディオなど、多様な入力形式を処理できるマルチモーダル認識において優れた性能を発揮しているためです。ユーザーはARグラスを使用する際、カメラを通して周囲環境のリアルタイムな解釈を得ることができ、例えば、未知の植物や建物を識別できます。さらに、通義モデルには即時翻訳機能も備わっており、ユーザーは外国でも円滑にコミュニケーションを取ることができ、コミュニケーション効率の大幅な向上に繋がります。
雷鳥创新と通義の協業は、ARグラスが複数のシナリオでより優れたインタラクション体験を実現しただけでなく、未来の消費電子機器業界に新たな機会をもたらしました。