人工智能正在突破視頻理解的最後邊界。當前市面上的AI工具雖然能夠分析單個視頻並生成摘要,但面對數千小時的多視頻內容時卻顯得力不從心。這個技術瓶頸正困擾着安防公司和營銷企業,前者需要AI篩查海量監控錄像,後者則希望分析不同的視頻營銷活動和產品拍攝素材。

一家名爲Memories.ai的初創公司正在用突破性技術重新定義這一領域。這個AI平臺擁有處理高達1000萬小時視頻的驚人能力,爲擁有大量視頻數據的企業提供完整的上下文理解層,包括可搜索的索引、標籤系統、片段分割和數據聚合功能。

投資,融資,錢

公司的兩位聯合創始人背景深厚,沈博士曾在Meta現實實驗室擔任研究科學家並攻讀博士學位,而周恩民則在Meta擔任機器學習工程師。這樣的技術基因爲Memories.ai的創新奠定了堅實基礎。

沈博士在接受採訪時指出了當前AI領域的核心問題:"Google、OpenAI和Meta等頂級AI公司都專注於開發端到端模型。這些能力固然出色,但這些模型在理解超過一到兩小時的視頻上下文方面往往存在侷限性。"

他進一步解釋道:"但人類使用視覺記憶時,我們會篩選大量的上下文數據。我們受到這一點的啓發,希望構建一個能夠更好地理解跨越數小時視頻內容的解決方案。"

這一願景得到了投資者的強烈認可。Memories.ai剛剛完成了由Susa Ventures領投的800萬美元種子輪融資,參與投資的還包括Samsung Next、Fusion Fund、Crane Ventures、Seedcamp和Creator Ventures。值得注意的是,公司最初計劃融資400萬美元,但由於投資者的濃厚興趣,最終獲得了超額認購。

Susa Ventures合夥人米沙·戈登-羅表達了對創始人的高度評價:"沈是一位技術實力極強的創始人,他癡迷於推進視頻理解和智能的邊界。Memories.ai能夠通過其解決方案釋放大量第一方視覺智能數據。我們認爲市場上在長上下文視覺智能方面存在空白,這正是吸引我們投資這家公司的原因。"

Samsung Next的投資邏輯則有所不同,這家三星的投資部門看中了Memories.ai在消費者市場的潛力。Samsung Next合夥人薩姆·坎貝爾表示:"我們看中Memories.ai的一點是它能夠進行大量設備端計算。這意味着你不一定需要將視頻數據存儲在雲端。這可以爲那些因隱私擔憂而不願在家中安裝安防攝像頭的人們提供更好的安全應用。"

Memories.ai的技術架構展現了其創新實力。公司使用自主開發的技術棧和模型進行分析,首先從視頻中去除噪音,然後通過壓縮層處理,只存儲重要數據。接下來是索引層,使視頻數據可通過自然語言查詢進行搜索,並提供分段和標籤功能。最後是聚合層,對索引數據進行彙總,幫助生成報告。

目前,這家初創公司主要服務兩類企業:營銷公司和安防公司。營銷企業可以使用其工具查找社交媒體上與品牌相關的趨勢,並確定要製作的視頻類型,Memories.ai還爲營銷人員提供視頻創作工具。同時,公司正與安防企業合作,幫助他們分析監控錄像,通過模式推理識別視頻中人員的潛在危險行爲。

現階段,與Memories.ai合作的企業需要將視頻庫上傳到平臺進行分析。不過沈博士透露,未來客戶將能夠創建共享驅動器並更輕鬆地同步內容,最終目標是讓用戶能夠提出諸如"告訴我上週採訪的所有人的情況"這樣的問題。

沈博士的願景更加宏大,他設想開發一個AI助手,能夠通過用戶的照片或智能眼鏡獲得對用戶生活的上下文理解。他還認爲這項技術將在訓練人形機器人執行復雜任務或幫助自動駕駛汽車記住不同路線方面發揮重要作用。

公司目前擁有15名員工,計劃利用新獲得的資金擴充團隊並改進搜索功能。在競爭格局方面,Memories.ai面臨着mem0和Letta等類似初創公司的競爭,這些公司也在爲AI模型提供記憶層,儘管它們目前的視頻支持有限。此外,還需要與TwelveLabs和Google等在幫助AI模型理解視頻方面已有所建樹的公司競爭。

然而,沈博士認爲他們公司的解決方案更具橫向擴展性,能夠與不同的視頻模型協同工作。這種技術優勢可能成爲Memories.ai在激烈競爭中脫穎而出的關鍵因素。

隨着視頻內容在數字世界中的爆炸式增長,能夠有效理解和分析長時間、多源視頻內容的AI技術將成爲下一個技術制高點。Memories.ai的突破性進展不僅爲企業提供了強大的視頻分析工具,也爲人工智能在視覺理解領域的發展開闢了新的可能性。