在精準醫學與生物標誌物發現的浪潮中,非靶向代謝組學扮演着至關重要的角色。然而,由於現有譜圖參比庫的不完整,化合物的鑑定依然面臨挑戰。爲了解決這一問題,德國聯邦材料研究與測試研究所(BAM)與柏林自由大學的研究團隊聯合開發了 FIORA,一種開源圖神經網絡(GNN),旨在模擬串聯質譜的過程,幫助提高質譜識別的準確性。

FIORA 模型的核心在於它利用分子中鍵的局部鄰域信息,學習化合物的斷裂模式,從而推導出碎離子的概率。與傳統的碎裂算法 ICEBERG 和 CFM-ID 相比,FIORA 在質量預測上表現優異,並能夠預測如保留時間(RT)和碰撞截面(CCS)等其他特徵。這一開創性的研究成果已於2025年3月7日發表在《Nature Communications》上。

image.png

FIORA 的設計充分利用了高性能 GPU,快速驗證推定的化合物註釋,並通過高質量的預測顯著擴展了光譜參考庫。這一進展對於推動非靶向代謝組學的研究具有重要意義,尤其是在對未知化合物進行分析時。過去十多年裏,由於高質量參考譜的稀缺,該領域的研究進展緩慢。例如,2016年 CASMI 挑戰賽顯示,計算機模擬方法的召回率僅爲34%,而2022年更是未達到30%。這表明迫切需要一種新的解決方案。

FIORA 的獨特之處在於,它能夠根據每個化合物的局部結構獨立評估鍵解離事件。這種方法比許多現有算法更爲直接地模擬質譜中的物理碎裂過程。此外,FIORA 不僅在針對相似化合物時表現出色,其對不熟悉結構的推廣能力也令人印象深刻。

爲確保其有效性,FIORA 在多個數據集上進行測試,結果顯示其預測的質譜與參考譜的相似度中位數達到0.8以上,甚至在某些情況下比競爭算法高出10% 到49%。此外,FIORA 的模塊化設計使其可以靈活適應不同的預測目標,展現了出色的多功能性。

FIORA 的推出不僅填補了質譜分析中的空白,更爲未來的化合物鑑定與研究提供了強有力的工具。