熱門資訊> 正文
2025-06-27 18:45
6月26日消息,Alphabet旗下人工智能研究機構DeepMind正在將基因組學帶入一個新紀元。通過推出全新AI模型AlphaGenome,DeepMind試圖解答困擾生物學家數十年的問題:人類DNA的哪一部分在疾病形成中發揮關鍵作用,又是如何發揮作用的。
五年前,谷歌推出了AlphaFold,一款用於預測蛋白質三維結構的AI模型。該技術因其在生物學上的變革性貢獻,去年榮獲諾貝爾獎,並催生了以藥物研發為目標的衍生公司Isomorphic Labs,同時帶動了 AI製藥創業熱潮。而如今的 AlphaGenome,則試圖回答另一個更基礎但同樣重要的問題:當DNA中的一個字母發生改變,會對基因表達產生怎樣的影響?這種影響是否與健康或疾病有關?
與以往專注短序列或單一任務的傳統模型不同,AlphaGenome可處理長達100萬個鹼基對的DNA片段,並實時預測涉及基因調控的多種生物學屬性—包括基因起始位置、剪接方式、RNA表達量,乃至蛋白質結合的可能性。
這款模型不僅僅關注已知的、僅佔基因組2%的蛋白質編碼區域,更首次全面涉足基因組的「暗物質」—龐大卻長期被忽視的非編碼調控區域。這些區域被視為調控基因何時何地開啟或關閉的關鍵所在,而正是這些位置往往藏着與癌症、罕見病甚至神經系統疾病密切相關的突變。未來,癌症或阿爾茨海默病等疾病可以更早被發現,更好地被理解,並實現更個性化的治療。
DeepMind表示,AlphaGenome是目前首款能夠在單一架構中整合長上下文與單鹼基分辨率預測能力的AI系統。通過引入卷積網絡與Transformer結合的架構,該模型實現了前所未有的精度和廣度—不但預測準,而且預測的內容也更加全面。
在實際應用中,研究人員可以向模型提交一段DNA序列,並迅速獲得關於該序列在不同組織和細胞中的調控活性評估。這種速度和效率,對於推動罕見病、癌症等領域的研究具有直接意義。
在一項案例研究中,AlphaGenome成功預測出白血病患者基因組中一處非編碼突變可能導致癌基因TAL1被異常激活,其機制為引入了一個新的MYB結合位點。這一預測與已知致病機制高度一致,顯示出 AlphaGenome 在揭示變異與疾病因果鏈條中的潛力。
據DeepMind披露,AlphaGenome在基因組預測領域的24項標準測試中,有22項表現超過現有最優模型。在突變效應預測任務上,26項中有24項表現持平或超越專門模型。
令人矚目的是,AlphaGenome是唯一一款跨任務、跨模態實現聯合預測的模型。此前,科研人員往往需藉助多個模型來完成這些任務,如今只需一次API調用,便可獲得全套預測結果,大大提升了研究效率。
更重要的是,在不犧牲性能的前提下,AlphaGenome的訓練成本大幅下降—訓練時間僅為4小時,所佔算力資源為前代Enformer模型的一半。
儘管當前版本僅用於非商業科研,且尚未用於個人基因診斷,但其潛在意義不言而喻。AlphaGenome的預測能力將推動科學家更快識別關鍵變異,提升對複雜疾病的早期篩查和靶向治療能力。「這項工作為精準醫學奠定了基礎,」 英國倫敦大學學院的癌症基因學教授馬克·曼索爾(Marc Mansour)表示:「我們終於擁有了一種可以大規模評估非編碼變異影響的工具,這是破解複雜疾病機制的關鍵。」
DeepMind也坦言,AlphaGenome並非全能。目前模型仍難以捕捉到距離目標基因10萬鹼基對以上的遠距離調控信號。此外,不同細胞和組織類型間的差異性捕捉仍在優化中。更重要的是,它不能取代醫學診斷—複雜性狀和疾病往往牽涉發育、生理及環境因素,而這些尚不在AlphaGenome的建模範疇內。
不過對科研社區而言,AlphaGenome提供了一個統一、強大且可擴展的工具框架。隨着更多數據的加入,它有望被擴展至其他物種,乃至未來支持臨牀應用。
本文來自「騰訊科技」,作者:無忌,36氪經授權發佈。