歐洲知名AI初創公司Multiverse Computing近日發佈了兩款極其微小的AI模型,小到可以用雞腦和蠅腦來命名。該公司聲稱這是全球最小但仍保持高性能的模型,能夠處理聊天、語音識別,其中一款甚至具備推理能力。
這些超小型模型專爲物聯網設備設計,同時可以在智能手機、平板電腦和個人電腦上本地運行。公司創始人羅曼·奧魯斯向TechCrunch表示:"我們可以將模型壓縮到如此程度,使其能夠適配各種設備。你可以在本地運行它們,直接在iPhone上,甚至在Apple Watch上。"
Multiverse Computing總部位於西班牙多諾斯蒂亞,在全球設有辦公室,員工約100人,是一家備受關注的歐洲AI初創公司。該公司由歐洲頂級量子計算和物理學教授羅曼·奧魯斯、量子計算專家塞繆爾·穆格爾和前Unnim銀行副首席執行官恩裏克·利薩索·奧爾莫斯共同創立。
今年6月,該公司憑藉名爲"CompactifAI"的模型壓縮技術成功融資1.89億歐元(約2.15億美元)。自2019年成立以來,公司累計融資約2.5億美元。
CompactifAI是一種量子啓發的壓縮算法,能夠在不犧牲模型性能的前提下減小現有AI模型的體積。奧魯斯解釋說:"我們擁有的壓縮技術不是計算機科學或機器學習領域人員會採用的典型壓縮技術,因爲我們來自量子物理學背景。這是一種更加精妙和精細的壓縮算法。"
該公司已經發布了大量開源模型的壓縮版本,特別是流行的小型模型如Llama4Scout或Mistral Small3.1,並剛剛推出了OpenAI兩個新開源模型的壓縮版本。公司還壓縮了一些大型模型,比如提供DeepSeek R1Slim版本。
專注於模型小型化的Multiverse將額外精力投入到創造儘可能小但功能強大的模型上。其兩款新模型小到足以爲幾乎任何物聯網設備帶來聊天AI功能,並且無需互聯網連接。公司幽默地稱這個系列爲"模型動物園",因爲產品是根據動物大腦尺寸命名的。
名爲SuperFly的模型是Hugging Face開源模型SmolLM2-135的壓縮版本。原始模型有1.35億個參數,專爲設備端使用開發。SuperFly壓縮至9400萬個參數,奧魯斯將其比作蠅腦的大小。他說:"這就像擁有一隻蒼蠅,但稍微聰明一點。"
SuperFly專爲在極其受限的數據上進行訓練而設計,比如設備操作數據。Multiverse設想將其嵌入家用電器中,讓用戶能夠通過語音命令操作設備,如對洗衣機說"開始快洗",或詢問故障排除問題。通過少量處理能力(如Arduino),該模型就能處理語音界面,公司向TechCrunch進行了現場演示。
另一款名爲ChickBrain的模型更大,有32億個參數,但功能也更強大,具備推理能力。Multiverse表示這是Meta Llama3.18B模型的壓縮版本,但小到足以在MacBook上運行,無需互聯網連接。
更重要的是,奧魯斯表示ChickBrain在多個標準基準測試中實際上略微超越了原始模型,包括語言技能基準MMLU-Pro、數學技能基準Math500和GSM8K,以及通用知識基準GPQA Diamond。
需要注意的是,Multiverse並未聲稱其模型動物園會在這些基準測試中擊敗最大的最先進模型,動物園的性能甚至可能不會出現在排行榜上。關鍵在於該公司的技術能夠在不影響性能的情況下縮小模型尺寸。
奧魯斯表示,公司已在與所有領先的設備和家電製造商進行洽談。他說:"我們正在與蘋果洽談,也在與三星、索尼和惠普對話。惠普在最後一輪融資中作爲投資者參與進來。"這輪融資由知名歐洲風投公司Bullhound Capital領投,包括HP Tech Ventures和東芝在內的多家機構參與。
這家初創公司還爲其他形式的機器學習提供壓縮技術,如圖像識別,在六年時間裏已獲得巴斯夫、Ally、穆迪、博世等客戶。
除了直接向主要設備製造商銷售模型外,Multiverse還通過託管在AWS上的API提供壓縮模型,任何開發者都可以使用,通常比競爭對手收取更低的token費用。