新浪科技の情報によると、最近、「霊光(Lingguang)」と呼ばれる新しいマルチモーダルアプリが、騰訊アプリ宝やvivoアプリストアなどのプラットフォームで静かにリリースされ、招待制のテストが開始されました。ユーザーは携帯電話番号または支付宝アカウントを使って直接ログインして体験できます。
「霊光」は杭州支払宝デジタルサービス技術有限公司によって開発されたもので、最大の特徴は内蔵されている「AGIカメラ」機能です。この機能はカメラレンズを通じて現実世界のシーンや内容を認識し理解し、撮影即時に質問し、リアルタイムで理解・回答を行うことができます。業界関係者はこの機能がビットバッターアプリ「豆包(Doubao)」やアリババの「元宝(Yuanbao)」アプリの画像認識機能に似ているものの、「認知レベルの理解」を強調しており、より強力なシナリオ分析やマルチモーダル推論能力を備えている可能性があると指摘しています。
実際には、アントグループはマルチモーダルおよびAGI分野において数か月間探求を続けてきました。今年4月下旬には、画像理解と生成の統一を初めて実現しました。5月には「Ming-Lite-omni-Preview」モデルを発表し、これはグローバルで最初にGPT-4oと同等のモーダルサポートを持つオープンソースモデルであり、音声や画像の生成および理解の統合能力を持っています。
