視頻平臺巨頭Kaltura正從“內容容器”向“智能交互界面”全面進化。近日,這家納斯達克上市企業宣佈以2700萬美元收購以色列AI數字人公司eSelf.ai,將後者領先的實時對話型虛擬人技術深度整合至其企業視頻生態。此舉標誌着Kaltura不再滿足於視頻的存儲與分發,而是押注“視頻即服務界面”(Video as an Interface)的下一代企業交互範式。
不只是“會動的嘴”,而是“看得懂、聽得清、說得明”的AI代理
eSelf.ai成立於2023年,由前Snap收購公司Voca創始人Alan Bekker與CTO Eylon Shoshan聯合創立,團隊僅15人卻深耕語音-視頻生成、低延遲語音識別與屏幕理解三大核心技術。其虛擬人不僅能實現逼真脣形同步,更能“看到”用戶屏幕內容並據此實時迴應——例如,當客戶在保險頁面停留時,數字人可主動解釋該產品條款;在培訓場景中,它能根據學員操作界面動態調整講解重點。

Kaltura CEO Ron Yekutiel強調,此次收購的核心價值在於eSelf具備真正的實時同步對話能力,而非市面上常見的“預錄語音+口型對齊”式僞交互。“我們需要的是能與用戶進行雙向、動態、上下文感知對話的AI,而非一個會說話的視頻片段。”
從企業視頻平臺,到AI體驗引擎
Kaltura目前服務超800家全球企業客戶,包括Amazon、Oracle、SAP、IBM及多家頂級金融機構與高校。其產品涵蓋企業視頻門戶、虛擬課堂、網絡研討會系統及TV流媒體解決方案。收購eSelf後,Kaltura將推出可嵌入銷售、客服、培訓等場景的獨立AI代理,爲企業提供“全棧式視頻智能”:
前端:高擬真數字人作爲交互入口;
中臺:對接CRM、知識庫、LMS等企業系統;
後端:基於用戶行爲與屏幕內容動態生成個性化響應。
Yekutiel指出,Kaltura的願景是讓視頻從“被動觀看”變爲“主動服務”——“我們始於視頻,進階至個性化視頻,如今通過eSelf,賦予AI以面孔、眼睛、耳朵和嘴巴,使其真正具備人類級表達與理解力。”
戰略佈局清晰,否認出售傳聞
儘管近期有媒體報道Kaltura正尋求以4億至5億美元估值出售,Yekutiel明確否認:“我們從未接近達成任何交易。”相反,此次收購是其第四次戰略併購(此前包括Tvinci、Rapt Media、Newrow),彰顯公司持續投入AI與視頻融合的決心。Kaltura2024年營收約1.8億美元,已實現Adjusted EBITDA與現金流雙盈利,擁有600名員工。
隨着eSelf團隊全員併入,Kaltura計劃在教育、金融、醫療、電商等高價值場景快速落地對話式AI代理。當企業客服不再只是聊天機器人,而是一個能“注視你、理解你、引導你”的數字專家,人機交互的臨界點,或許正在到來。
