據新浪科技消息,近日,一款名爲 “靈光” 的全新多模態應用已在騰訊應用寶、vivo 應用商店等平臺悄然上線,並開啓邀約內測。用戶可通過手機號或支付寶賬號直接登錄體驗。
據悉,“靈光”由 支付寶(杭州)數字服務技術有限公司開發,其最大亮點在於內置的 “AGI 相機” 功能。這一功能可通過相機鏡頭識別並理解現實世界中的場景與內容,實現拍攝即問、實時理解與回答。有業內人士指出,該功能與字節跳動的 豆包 App、阿里 元寶 App 的圖像識別功能類似,但靈光更強調“認知層理解”,或具備更強的場景分析與多模態推理能力。
事實上,螞蟻集團在多模態與 AGI 方向的探索已持續數月。今年4月底,螞蟻首次實現了圖像理解與生成的統一;5月份又推出了 Ming-Lite-omni-Preview 模型,這是全球首個在模態支持上可媲美 GPT-4o 的開源模型,具備語音、圖像的生成與理解整合能力。
