繼學術界孵化出多個現象級 AI 引擎後,開源推理框架 vLLM 的核心成員正式宣佈成立初創公司 Inferact。該公司以 8億美元的投前估值,成功完成了高達 1.5億美元的種子輪融資。

頂級資本加持,加速“推理”商業化
本輪融資由 Andreessen Horowitz (a16z) 和 Lightspeed Venture Partners 共同領投。此舉證實了市場此前關於 vLLM 商業化路徑的猜測,也標誌着 AI 行業的重心正從“模型訓練”全面轉向“應用推理”。
技術背景: Inferact 孵化自加州大學伯克利分校 Ion Stoica 教授(Databricks 聯合創始人)的實驗室。其核心技術 vLLM 通過創新的顯存管理技術,能顯著提升大模型運行速度並降低能耗。
市場地位: 首席執行官 Simon Mo 表示,vLLM 的開源版本已被亞馬遜雲服務(AWS)及亞馬遜購物等巨頭廣泛採用。
推理賽道的“伯克利雙雄”
Inferact 的亮相緊隨 RadixArk(由另一知名框架 SGLang 商業化而來)之後。後者近期剛獲得由 Accel 領投、估值4億美元的融資。兩家公司均出自伯克利實驗室,它們的接連獲投反映出投資者正不惜重金,搶佔更快速、更經濟的 AI 部署技術高地。
