前 Meta 工程師創立的人工智能研究實驗室 EvolutionaryScale 最近推出了 ESM3,一種具有原生多模式和生成語言模型的生物程序設計工具。

image.png

這種模型可根據特定提示來設計新蛋白質。實驗結果表明,該模型能夠生成一種新的綠色熒光蛋白(esmGFP),而這種蛋白質如果按照自然演化的速度來進行研究,需要耗費數億年的時間。

EvolutionaryScale 已經完成了一輪1420萬美元的種子輪融資,由 Nat Friedman、Daniel Gross 和 Lux Capital 領投,AWS 和英偉達的風險投資部門也參與了投資。ESM3共有三種規格,最小的版本已經公開發布,而中等和大型版本則通過 EvolutionaryScale 的 API 進行商業化運營。

image.png

爲什麼 EvolutionaryScale 在生物領域引入人工智能?雖然生成式人工智能模型在理解和推理人類語言方面已經取得了重大進展,但許多人想知道我們是否可以訓練這些模型來解讀生命的核心語言,然後使用它們來開發新型分子。生命的核心分子,包括 RNA、蛋白質和 DNA,是通過自然化學反應在過去35億年中不斷演化而來的。因此,能夠編程生物並設計新分子的方法可能爲解決人類面臨的一些最大挑戰,包括氣候變化、塑料污染和癌症等條件,鋪平道路。

下圖所示的第一個盤子中,我們很感興趣地找到了 B8。雖然非常暗淡,比天然GFP暗50倍,但它與任何已知的GFP相去甚遠 - 其43%的序列與最接近的天然蛋白質不同。 在下面第二個板上繼續B8的思路,ESM3發現了C10,它與天然熒光蛋白相似。

image.png

多個組織,包括 Google Deepmind 和 Isomorphic Labs,已經在這一領域開展了工作,EvolutionaryScale 是最新加入的一員。該公司在2023年成立,最近幾個月開發了幾個蛋白質語言模型,但其最新產品 ESM3是其中最大的,且具有原生多模式和生成式。

劃重點:

💡 前 Meta 工程師創立的 EvolutionaryScale 推出了 ESM3,一種具有原生多模式和生成語言模型的生物程序設計工具。

💡 ESM3在測試中生成了一種新的綠色熒光蛋白,相當於模擬了超過5億年的進化歷程,對生物領域有巨大的應用潛力。

💡 ESM3共有三種規格,最小的版本已經公開發布,而中等和大型版本則通過 EvolutionaryScale 的 API 進行商業化運營。