Gartner預測：到2027年，40% 的生成式AI解決方案將實現多模態融合

在最近的 Gartner IT 研討會上，分析師們分享了一項引人注目的預測:到2027年，40% 的生成式人工智能（GenAI）解決方案將實現多模態整合，能夠同時處理文本、圖像、音頻和視頻。這一比例相比於2023年的1% 有了飛躍式的增長。這項變革將對企業應用產生深遠的影響。

AI 醫療

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

Gartner 的高級副總裁 Erick Brethenoux 指出，隨着 GenAI 市場向多模態模型的發展，這將有助於捕捉不同數據流之間的關係，並可能在各類數據和應用中擴展 GenAI 的好處。他強調，多模態 GenAI 可以支持人類在不同環境中執行更多任務。

根據2024年 Gartner 生成式人工智能技術熱潮週期報告，多模態 GenAI 和開源大語言模型（LLM）被認爲具有極高影響力，預計將在未來五年內企業帶來顯著的競爭優勢和市場響應速度。Gartner 還指出，未來十年內，特定領域的 GenAI 模型和自主代理將有望實現主流應用。

分析師 Arun Chandrasekaran 提到，企業在 GenAI 生態系統中的導航將會充滿挑戰，因爲技術和供應商的環境變化迅速。儘管目前 GenAI 處於 “失望的低谷”，但隨着行業整合的開始，真正的好處將在炒作消退後顯現，能力的提升也將快速推進。

多模態 GenAI 的轉型將增強企業應用，引入更多新功能。目前許多多模態模型僅限於處理兩到三種模式，但預計這種多樣性在未來幾年將會增加。Brethenoux 提到，現實生活中，人們通過音頻、視覺和感覺的結合來理解信息，因此多模態 GenAI 至關重要。

對於開源大語言模型，Chandrasekaran 指出，其爲企業提供了創新潛力，可以通過定製、隱私與安全控制、模型透明性等方面，降低對特定供應商的依賴。最終，開源 LLM 能夠提供更小、更易訓練的模型，助力企業核心業務流程。

特定領域的 GenAI 模型針對特定行業或任務進行了優化，能夠改善企業內用例的對齊，並提升準確性和安全性。Chandrasekaran 進一步表示，這些模型能夠實現更快的價值體現，更好的性能，以及更強的安全性，鼓勵組織在更廣泛的用例中採用 GenAI。

自主Agent系統可以在沒有人類干預的情況下實現目標，利用 AI 技術識別模式、做出決策和生成輸出。Brethenoux 強調，自主代理代表了 AI 能力的重大飛躍，這將推動業務運營的改善和客戶體驗的提升，同時也可能導致組織內從執行到監督的工作模式轉變。

劃重點:
🌟 到2027年，40% 的生成式人工智能解決方案將實現多模態整合，較2023年大幅提升。
🚀 多模態 GenAI 和開源大語言模型預計將在未來五年內帶來顯著的競爭優勢。
🔍 特定領域的 GenAI 模型能提高企業應用的準確性和安全性，鼓勵更廣泛的採用。

美國修訂隱私法案:擬十年撥款10億禁止AI公司出售健康數據