在最近的 Gartner IT 研討會上,分析師們分享了一項引人注目的預測:到2027年,40% 的生成式人工智能(GenAI)解決方案將實現多模態整合,能夠同時處理文本、圖像、音頻和視頻。這一比例相比於2023年的1% 有了飛躍式的增長。這項變革將對企業應用產生深遠的影響。

AI 醫療

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

Gartner 的高級副總裁 Erick Brethenoux 指出,隨着 GenAI 市場向多模態模型的發展,這將有助於捕捉不同數據流之間的關係,並可能在各類數據和應用中擴展 GenAI 的好處。他強調,多模態 GenAI 可以支持人類在不同環境中執行更多任務。

根據2024年 Gartner 生成式人工智能技術熱潮週期報告,多模態 GenAI 和開源大語言模型(LLM)被認爲具有極高影響力,預計將在未來五年內企業帶來顯著的競爭優勢和市場響應速度。Gartner 還指出,未來十年內,特定領域的 GenAI 模型和自主代理將有望實現主流應用。

分析師 Arun Chandrasekaran 提到,企業在 GenAI 生態系統中的導航將會充滿挑戰,因爲技術和供應商的環境變化迅速。儘管目前 GenAI 處於 “失望的低谷”,但隨着行業整合的開始,真正的好處將在炒作消退後顯現,能力的提升也將快速推進。

多模態 GenAI 的轉型將增強企業應用,引入更多新功能。目前許多多模態模型僅限於處理兩到三種模式,但預計這種多樣性在未來幾年將會增加。Brethenoux 提到,現實生活中,人們通過音頻、視覺和感覺的結合來理解信息,因此多模態 GenAI 至關重要。

對於開源大語言模型,Chandrasekaran 指出,其爲企業提供了創新潛力,可以通過定製、隱私與安全控制、模型透明性等方面,降低對特定供應商的依賴。最終,開源 LLM 能夠提供更小、更易訓練的模型,助力企業核心業務流程。

特定領域的 GenAI 模型針對特定行業或任務進行了優化,能夠改善企業內用例的對齊,並提升準確性和安全性。Chandrasekaran 進一步表示,這些模型能夠實現更快的價值體現,更好的性能,以及更強的安全性,鼓勵組織在更廣泛的用例中採用 GenAI。

自主Agent系統可以在沒有人類干預的情況下實現目標,利用 AI 技術識別模式、做出決策和生成輸出。Brethenoux 強調,自主代理代表了 AI 能力的重大飛躍,這將推動業務運營的改善和客戶體驗的提升,同時也可能導致組織內從執行到監督的工作模式轉變。

劃重點:

🌟 到2027年,40% 的生成式人工智能解決方案將實現多模態整合,較2023年大幅提升。  

🚀 多模態 GenAI 和開源大語言模型預計將在未來五年內帶來顯著的競爭優勢。  

🔍 特定領域的 GenAI 模型能提高企業應用的準確性和安全性,鼓勵更廣泛的採用。