正文

微軟開源多模態模型LLaVA-1.5媲美GPT-4V效果

發布於AI新閒資訊

時間 :Jan 31, 2024

閱讀 :1分鐘

微軟最新發布了多模態模型LLaVA-1.5，其引入了跨模態連接器和學術視覺問答數據集，取得了多個領域的成功測試。該模型不僅達到了開源模型的最高水平，還融合了視覺、語言、生成器等多個模塊。據測試表明，LLaVA-1.5的性能媲美GPT-4V，是一項令人振奮的技術突破。

微軟雲端隱憂：千億營收背後的增速換擋與槓桿風險

雲服務巨頭軍備競賽白熱化。微軟雲年營收首破千億美元，增速43%；但谷歌雲以82%增速反超。谷歌憑藉自研模型與芯片的完整生態，將運營利潤率從20.7%大幅推高，凸顯技術路徑決定商業回報的差異。

微軟正開發整合Copilot聊天、編碼助手與智能代理的AI“超級應用”，計劃年內推出，覆蓋消費者與商業場景。CEO納德拉稱Copilot正從聊天轉向協同辦公和自動化執行，本季度將統一整合不同Copilot體驗。

微軟作爲最大雲服務商之一，同時持股OpenAI與Anthropic。但兩家公司正向應用層及智能體基礎設施擴張，

微軟納德拉在財報會上稱，將力推多模型架構，加大自研AI模型、智能體及安全產品投入，以降低對單一前沿AI實驗室的依賴。財務方面，微軟全年營收3318億美元、淨利1337億美元，最新季度營收900億美元、淨利358億美元，AI業務高速擴張背景下，公司仍保持全球雲服務領先地位。

微軟財報意外曝光AI投資回報分化：對Anthropic的50億美元投資單季收益32億美元，接近OpenAI全年收益規模；同期對OpenAI的投資卻減值約6億美元。微軟雙線押注策略初見分曉，凸顯Anthropic強勁回報與OpenAI的賬面壓力。

智啟未來，您的人工智能解決方案智庫