倫敦初創公司Basecamp Research最近成功融資6000萬美元,正在開發一個令人矚目的生物學AI助手。這個項目不僅旨在回答與生物學和自然世界生物多樣性相關的任何問題,更有望產生人類無法獨立獲得的新見解,爲生物科技領域帶來革命性突破。

Basecamp Research的聯合創始人兼CEO Glen Gowers指出,當前生物學模型訓練存在巨大的數據缺口。即使是全球頂尖的製藥公司,其訓練的模型也無法全面涵蓋自然世界的複雜性。這一觀點凸顯了Basecamp Research項目的重要性和潛在影響。

蛋白組織 生物

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

公司的發展勢頭強勁。據Gowers透露,Basecamp Research已與25個國家的100多個組織建立了合作伙伴關係,以擴充其原始信息數據庫。其中約15個組織正在利用其AI技術開發新產品。例如,寶潔公司正在使用這些模型設計酶,用於生產能在低溫下清除污漬的洗滌劑;Colorifix則致力於開發更可持續的新型織物染料配方。

更引人注目的是,Basecamp Research聲稱其基礎模型BaseFold在準確預測大型複雜蛋白質結構和小分子相互作用方面,表現優於剛剛獲得諾貝爾化學獎的DeepMind公司的AlphaFold2模型。這一斷言無疑爲Basecamp Research的技術實力提供了有力佐證。

Basecamp Research採用了一種雄心勃勃的方法來構建生物學AI:從頭開始構建模型。創始人Glen Gowers和Oliver Vince都擁有生物學博士學位,他們的合作始於牛津大學本科時期。公司名稱"Basecamp Research"源於他們曾經在冰蓋上生活的經歷,當時他們使用自制硬件進行DNA測序。

Vince提到,他們開創了首個移動DNA測序實驗室,並將該硬件的某些組件改造成小型單元,用於爲新創公司收集數據。這種創新精神和實踐經驗爲Basecamp Research奠定了堅實的技術基礎。

儘管生物學領域已經積累了大量的研究成果和數據,但許多數據已經過時、結構混亂或不一致。因此,Basecamp Research正在通過一手收集原始數據來構建模型。他們的目標是開發出一個能比任何人類更深入洞察生物學的AI系統,這源於其能夠處理和分析的海量數據。

Gowers解釋道,他們將探索活動(如考察世界各地的溫泉、火山等)與專注於訓練大型語言模型的AI程序相結合,本質上是在打造一個"自然界的ChatGPT"。公司還建立了可能是目前最大的專門用於研究自然世界的計算集羣。

與ChatGPT擅長回憶和構建自然語言響應類似,Basecamp Research的AI也具備這種能力。不同之處在於,由於我們對世界生物多樣性的瞭解僅限於約1%,人類目前甚至無法提出正確的問題。正如投資者、前谷歌Verily生命科學公司CEO Andy Conrad所言,Basecamp Research的平臺能夠"解答生物製藥行業尚未意識到需要提出的問題"。

Gowers進一步解釋,他們的平臺不僅理解文本或語音的語言,還能理解DNA和生物學的語言,因此能在生物設計領域超越人類的能力。傳統上,人類在理解DNA方面存在侷限,而這些語言模型如果獲得足夠的數據,就能在這一領域大顯身手。

這輪B輪融資由歐洲公司Singular領投,同時Basecamp Research還宣佈與David R. Liu博士和哈佛-麻省理工學院布羅德研究所展開多年合作。公司計劃利用這筆資金繼續擴大與其他生物醫學和研究組織的合作,並收集更多數據來擴展其模型。

Basecamp Research的未來規劃包括協助組織進行藥物發現和其他涉及理解和更好利用自然世界的重大挑戰。目前,Liu博士領導的實驗室正在研究用於創造基因藥物的"新型融合蛋白和其他大分子",並使用Basecamp Research的數據集來開發這些分子。

值得注意的是,Basecamp Research目前更傾向於專注B2B業務,而非開發面向普通公衆的產品。這種策略似乎也是其他構建大型"科學"模型的公司所採用的方法,例如正在構建大型物理模型的Jua公司最初就針對需要更好洞察天氣模式的組織。

雖然Basecamp Research沒有披露具體估值,但表示這輪B輪融資是一輪上漲輪。公司迄今已籌集8500萬美元,先前的投資者包括Hummingbird、True Ventures和戰略投資者Valo。根據PitchBook的數據,公司在2022年的估值爲7100萬美元。

本輪融資還吸引了S32、redalpine、羅氏副董事長André Hoffmann、皇家飛利浦董事長兼前DSM CEO Feike Sijbesma以及前聯合利華CEO Paul Polman等知名投資者的參與。