在生物科學和計算機科學的交匯點上,AlphaFold3自從發佈以來,就如同一顆超級明星,吸引了無數目光。可惜的是,谷歌 DeepMind 只給了我們一篇論文,卻沒有提供任何代碼或模型權重,像是一道美味的蛋糕,卻只讓大家看看外觀,沒法動手嚐嚐。面對這種 “閉門造車” 的做法,很多團隊都在爭先恐後地進行復現工作。
就在這熱火朝天的氛圍中,一家名爲 Ligo 的初創公司脫穎而出,成爲首個復現 AlphaFold3的團隊,而這個團隊的三位創始人全都是牛津大學的本科生。他們在短短四個月內就實現了這一壯舉,簡直是給科學界送上了一份大禮。

AlphaFold3被視爲生物科學領域的里程碑,尤其在蛋白質結構預測方面,它的應用潛力巨大。然而,DeepMind 的策略讓人頗感失望,他們的作品只在特定服務器上供科學家們使用,且每天調用次數有限,似乎在爲未來的商業利益埋下伏筆。即便如此,研究人員們卻對這一成果充滿期待,因爲它有可能徹底改變藥物發現的遊戲規則。
就在衆多科學家感到挫敗的時候,Ligo 團隊卻勇敢地邁出了第一步。他們不僅復現了 AlphaFold3的模型,還計劃將其開源,讓更多人受益。Ligo 團隊表示,他們的模型目前可以有效預測蛋白質結構,而其他功能將在不久後跟進。
復現的過程並不簡單,團隊將 DeepMind 論文中的模型架構完全轉化爲 PyTorch 代碼。在這個過程中,他們發現了一些原始論文中的問題,比如損失函數的公式錯誤,這可能會影響訓練效果。此外,他們還對原有模型進行了優化,比如引入了殘差層來改善梯度流。
令人興奮的是,Ligo 團隊在這項工作中不僅遵循了原有模型的思路,還進行了創新,嘗試了更高效的實現方式。他們甚至在訓練過程中只用了8個 A100GPU,便生成了相應的模型,效率之高令人矚目。
儘管 DeepMind 因商業原因暫時將成果封閉,但 Ligo 的成功復現讓人們看到了希望,也引發了更多團隊的跟進。除了 Ligo,哥倫比亞大學的 OpenFold 團隊和獨立開發者 Phil Wang 也在積極參與這一開源運動,形成了一個生動的科研生態。
項目地址:https://github.com/Ligo-Biosciences/AlphaFold3
