歐洲知名AI初創公司Multiverse Computing近日發佈了兩款超小型AI模型,並以動物大腦尺寸命名——分別爲"蒼蠅腦"SuperFly和"雞腦"ChickBrain。這家聲稱擁有全球最小高性能AI模型的公司,正試圖將人工智能帶入每一臺物聯網設備。

Multiverse Computing總部位於西班牙聖塞巴斯蒂安,擁有約100名員工,由歐洲頂級量子計算和物理學教授Román Orús、量子計算專家Samuel Mugel以及前Unnim銀行副CEO Enrique Lizaso Olmos共同創立。該公司剛剛在6月完成了1.89億歐元(約2.15億美元)的融資,自2019年成立以來累計融資約2.5億美元。

公司的核心技術是名爲"CompactifAI"的模型壓縮技術。Orús表示,這是一種基於量子物理原理的壓縮算法,能夠在不犧牲性能的前提下大幅縮減AI模型的尺寸。"我們擁有的壓縮技術不同於傳統的計算機科學或機器學習壓縮方法,因爲我們來自量子物理學領域,"他解釋道,"這是一種更加精巧和細緻的壓縮算法。"

image.png

SuperFly模型是該公司"模型動物園"系列中最小的一款,基於Hugging Face開源模型SmolLM2-135壓縮而成。原始模型擁有1.35億個參數,而SuperFly壓縮至9400萬參數,Orús形象地將其比作蒼蠅大腦的尺寸。

SuperFly專門針對資源受限的設備設計,能夠在極小的處理能力下運行。該模型可以嵌入家用電器中,用戶可以通過語音命令操作設備,比如對洗衣機說"開始快洗",或者詢問故障排除問題。在現場演示中,該模型配合簡單的Arduino處理器就能夠處理語音交互界面。

更強大的ChickBrain模型擁有32億參數,基於Meta的Llama3.18B模型壓縮而成,具備推理能力。儘管參數量更大,但該模型仍然足夠小巧,可以在MacBook上離線運行。

令人驚訝的是,ChickBrain在多個標準基準測試中的表現實際上略優於原始模型,包括語言技能基準MMLU-Pro、數學技能基準Math500和GSM8K,以及通用知識基準GPQA Diamond。這證明了該公司壓縮技術的有效性——不僅縮小了模型尺寸,還能保持甚至提升性能。

Multiverse已經開始與各大設備製造商進行洽談。Orús透露:"我們正在與蘋果、三星、索尼和惠普等公司進行對話。惠普還參與了上一輪投資。"該輪融資由知名歐洲風投公司Bullhound Capital領投,惠普科技風險投資和東芝等多家機構參投。

除了直接向設備製造商銷售模型外,Multiverse還通過託管在AWS上的API爲開發者提供壓縮模型服務,通常token費用比競爭對手更低。該公司已經爲BASF、Ally、穆迪、博世等客戶提供了包括圖像識別在內的各種機器學習壓縮技術服務。

這些超小型AI模型的推出標誌着人工智能應用的一個重要趨勢——從雲端大模型向邊緣設備小模型的轉變。通過將AI能力直接嵌入到物聯網設備中,用戶可以享受更快的響應速度、更好的隱私保護以及無需網絡連接的離線智能體驗。

隨着物聯網設備的普及和邊緣計算需求的增長,像Multiverse這樣專注於模型壓縮技術的公司可能會迎來巨大的市場機遇。其基於量子物理原理的獨特壓縮算法不僅展現了技術創新的可能性,也爲AI技術的普及化應用開闢了新的道路。