微軟最新發布了多模態模型LLaVA-1.5,其引入了跨模態連接器和學術視覺問答數據集,取得了多個領域的成功測試。該模型不僅達到了開源模型的最高水平,還融合了視覺、語言、生成器等多個模塊。據測試表明,LLaVA-1.5的性能媲美GPT-4V,是一項令人振奮的技術突破。