OpenAI週四正式推出GPT-Rosalind,一款專爲生物學研究場景深度訓練的垂直領域大語言模型。有別於谷歌、微軟等巨頭押注的通用科學模型路線,OpenAI這次選擇了一條更聚焦的賽道——直擊生物學研究的核心痛點。

生命科學產品負責人王昀昀在發佈會上點明瞭這款模型的使命:幫助研究者突破兩道長期橫亙在面前的高牆——數十年基因組測序堆積的海量數據,以及高度細分的專業術語壁壘。現實情況是,一位專注於特定基因的遺傳學家,面對鋪天蓋地的神經生物學文獻時往往無從下手,信息過載已成爲當下生物學研究的普遍困境。

image.png

爲此,OpenAI在通用大模型底座之上,整合了50種常見生物工作流及主流公共數據庫訪問能力,讓模型具備連接基因型與表型、推斷蛋白質結構與功能、進而篩選潛在藥物靶點的能力。與此同時,團隊還專項調整了模型的"性格"——刻意強化批判性思維,避免一味迎合用戶,面對低價值靶點時,模型會選擇直接否定。

當然,挑戰同樣不容迴避。幻覺問題至今懸而未決,模型可能生成看似合理卻經不起推敲的內容,在嚴謹的科學研究中風險不小,OpenAI也坦承尚無完整解法,提醒用戶保持審慎。生物安全層面的隱患同樣不可忽視,一旦被惡意利用於強化病毒傳染性,後果將難以想象。爲此,OpenAI對訪問權限實施嚴格管控,目前僅向美國本土實體開放申請,功能受限的生命科學插件則將面向更廣泛用戶逐步開放。

聯合創始人Greg Brockman將GPT-Rosalind定位爲OpenAI在生命科學領域的前沿探索,朝着"加速科學發展、改善人類福祉"這一目標邁出的重要一步。