欧洲知名AI初创公司Multiverse Computing近日发布了两款极其微小的AI模型,小到可以用鸡脑和蝇脑来命名。该公司声称这是全球最小但仍保持高性能的模型,能够处理聊天、语音识别,其中一款甚至具备推理能力。

这些超小型模型专为物联网设备设计,同时可以在智能手机、平板电脑和个人电脑上本地运行。公司创始人罗曼·奥鲁斯向TechCrunch表示:"我们可以将模型压缩到如此程度,使其能够适配各种设备。你可以在本地运行它们,直接在iPhone上,甚至在Apple Watch上。"

Multiverse Computing总部位于西班牙多诺斯蒂亚,在全球设有办公室,员工约100人,是一家备受关注的欧洲AI初创公司。该公司由欧洲顶级量子计算和物理学教授罗曼·奥鲁斯、量子计算专家塞缪尔·穆格尔和前Unnim银行副首席执行官恩里克·利萨索·奥尔莫斯共同创立。

image.png

今年6月,该公司凭借名为"CompactifAI"的模型压缩技术成功融资1.89亿欧元(约2.15亿美元)。自2019年成立以来,公司累计融资约2.5亿美元。

CompactifAI是一种量子启发的压缩算法,能够在不牺牲模型性能的前提下减小现有AI模型的体积。奥鲁斯解释说:"我们拥有的压缩技术不是计算机科学或机器学习领域人员会采用的典型压缩技术,因为我们来自量子物理学背景。这是一种更加精妙和精细的压缩算法。"

该公司已经发布了大量开源模型的压缩版本,特别是流行的小型模型如Llama4Scout或Mistral Small3.1,并刚刚推出了OpenAI两个新开源模型的压缩版本。公司还压缩了一些大型模型,比如提供DeepSeek R1Slim版本。

专注于模型小型化的Multiverse将额外精力投入到创造尽可能小但功能强大的模型上。其两款新模型小到足以为几乎任何物联网设备带来聊天AI功能,并且无需互联网连接。公司幽默地称这个系列为"模型动物园",因为产品是根据动物大脑尺寸命名的。

名为SuperFly的模型是Hugging Face开源模型SmolLM2-135的压缩版本。原始模型有1.35亿个参数,专为设备端使用开发。SuperFly压缩至9400万个参数,奥鲁斯将其比作蝇脑的大小。他说:"这就像拥有一只苍蝇,但稍微聪明一点。"

SuperFly专为在极其受限的数据上进行训练而设计,比如设备操作数据。Multiverse设想将其嵌入家用电器中,让用户能够通过语音命令操作设备,如对洗衣机说"开始快洗",或询问故障排除问题。通过少量处理能力(如Arduino),该模型就能处理语音界面,公司向TechCrunch进行了现场演示。

另一款名为ChickBrain的模型更大,有32亿个参数,但功能也更强大,具备推理能力。Multiverse表示这是Meta Llama3.18B模型的压缩版本,但小到足以在MacBook上运行,无需互联网连接。

更重要的是,奥鲁斯表示ChickBrain在多个标准基准测试中实际上略微超越了原始模型,包括语言技能基准MMLU-Pro、数学技能基准Math500和GSM8K,以及通用知识基准GPQA Diamond。

需要注意的是,Multiverse并未声称其模型动物园会在这些基准测试中击败最大最先进模型,动物园的性能甚至可能不会出现在排行榜上。关键在于该公司的技术能够在不影响性能的情况下缩小模型尺寸。

奥鲁斯表示,公司已在与所有领先的设备和家电制造商进行洽谈。他说:"我们正在与苹果洽谈,也在与三星、索尼和惠普对话。惠普在最后一轮融资中作为投资者参与进来。"这轮融资由知名欧洲风投公司Bullhound Capital领投,包括HP Tech Ventures和东芝在内的多家机构参与。

这家初创公司还为其他形式的机器学习提供压缩技术,如图像识别,在六年时间里已获得巴斯夫、Ally、穆迪、博世等客户。

除了直接向主要设备制造商销售模型外,Multiverse还通过托管在AWS上的API提供压缩模型,任何开发者都可以使用,通常比竞争对手收取更低的token费用。