繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

自研生物結構預測基礎模型,「探序秩元」試圖打破新葯研發雙十定律 | 早期項目

2025-08-04 08:10

長久以來,科學研究的範式都以數學原理和實驗觀測為基礎。從牛頓的《自然哲學的數學原理》到愛因斯坦的質能方程,科學家們藉助公式、定律、實驗和精確計算,來理解和預測自然。

而今,隨着生成式人工智能的發展,特別是Transformer和Diffusion模型在文本、多模態等領域大放異彩,「生成式科學」有可能改變既往的科學研究範式,即不再拘泥於對每一箇中間步驟的精確數學描述和實驗驗證,而是依靠海量科學數據(如基因序列、結構等)進行基石模型訓練並獲得直接生成結果的能力,以達到「相對準、絕對快、絕對廣」的更優效果。

這種「生成式科學」的真正開端是AlphaFold 2誕生,革命性地解決了蛋白質「從序列到結構」的預測問題。2023年,AlphaFold 3發佈,將能力擴展到蛋白質與核酸、小分子、抗體等複雜生物分子的相互作用,這使得AF3具備了指導藥物研發的潛力。

2024年初,Deepmind 旗下負責AF3產業化的子公司Isomorphic Labs,從禮來、諾華兩家MNC獲得了鉅額訂單,合作開發多靶點的小分子療法,預付款分別高達4500萬美元、3750萬美元。值得一提的是,2025年初,諾華宣佈拓展與Isomorphic Labs的合作,進一步增加合作研究數量。這也意味着諾華對其探索「未公開靶點」藥物能力的認可。

36氪瞭解到,2024年下半年成立的新創公司探序秩元(以下簡稱探序),在生成式科學(Generative Science)的浪潮中,新近發佈了自研基礎模型IntelliFold。目前已開放公開server。

創始人孫鵬是一位前tech venture投資人,職業生涯開始於 Accenture管理諮詢、后於明勢資本等VC機構任職,多年從事前沿科技投資,擁有豐富的AI投資與產業經營經驗;首席科學家孫思琦為復旦大學研究員、博士生導師,在芝加哥大學TTI-Chicago 讀博期間師從許錦波教授。2018-2022年間,孫思琦於微軟西雅圖總部工作,投身於前沿的大語言模型技術研究。回國后致力於AI在交叉學科中的創新應用,圍繞結構生物學智能計算領域的精度與效率瓶頸取得系統性前沿突破,成果發表於Science、Nature子刊等系列頂刊,總引用超過7000次。

孫鵬對36氪介紹,探序秩元的科研團隊成員大多同時具有「結構生物學+大語言模型」雙重研發背景,因此有能力自主開發結構預測基礎模型。

「幾年前,AI對於結構生物學面臨的結合預測和設計任務,價值以效率提升爲主;但現在要用新的AI做傳統技術難以解決的問題,如高效探索未公開靶點,又或設計藥化學家未曾涉獵、甚至超越人類直覺的全新產物等,在這個過程中AI大模型不可或缺。但我們所做的事,不像訓練通用大語言模型那樣算力消耗甚巨無底,同時其產業價值轉化的路徑更短、更明確。用生成式科學模型直接參與科學研究探索,是AGI展開為智能生產力的三個一級切入點之一。」

據瞭解,IntelliFold的定位是「可控的基礎模型」。這意味着,一方面它可以對多種生物分子(蛋白質、核酸、小分子、離子、修飾殘基等)之間的相互作用進行高精度三維結構預測;同時,通過應用輕量級的可訓練適配器,它可以被引導和控制,進而實現別構預測、給定口袋結合預測等特異性針對能力,幫助完成藥物發現等特定下游應用所需的複雜任務。

圖源報告:《IntelliFold:一個用於通用和特化生物分子結構預測的可控基礎模型》

據公司提供的技術測試報告,IntelliFold在蛋白質結構預測測試的多個關鍵指標與AF3表現相當,如蛋白質單體結構預測、蛋白質-蛋白質界面預測、蛋白質-DNA/RNA界面等。在抗體-抗原界面、蛋白質-配體相互作用預測方面,成功率略低於AF3。值得注意的是,在RNA單體預測上,甚至超越了AF3,展現了其在覈酸結構預測上的優勢。

「給定具體蛋白質序列,IntelliFold模型可以預測它與小分子的結合構象及模式,這是我們當前技術為具特點、也是市場有明確需求的方向之一,」孫鵬表示。「除預測別構等特異性結合模式外,IntelliFold模型還可以預測Affinity(結合親和力,衡量藥物效力的核心指標之一)數值,可以增強藥物虛擬篩選的效率和準確性。」

在藥物設計中,蛋白質可能會根據結合的分子產生構象變化,形成不同的功能狀態,例如激酶家族中的CDK2,其活性可能受到抑制劑誘導的別構變化影響。這對於藥物設計至關重要,卻難以在大模型中有效訓練。但通過目標特異性適配器,IntelliFold能夠正確預測別構構象,「識別罕見構象狀態,同時不影響模型在正構狀態上的準確性。」這對藥物的精準設計的靈活性頗為重要。

同時,孫鵬還提到,生成式科學模型也正在對蛋白質設計帶來快速變革;與經典的專家主導藥物設計範式不同,生成式模型可以完全從頭設計(De Novo Design)每一個氨基酸的位置及可能,甚至探索自然界不存在但可能更優的結果。「雖然蛋白質從頭設計的難點部分異於結合預測,但二者使用的基石模型源流相通近似,相互具備橫向拓展的能力;基石模型能力,毫無疑問是未來獲取具體場景領先性與產業可用性的關鍵前提。」

在探序秩元的未來規劃中,希望能將IntelliFold打造成通用的智能科學基石模型,在不同具體任務上發揮引擎作用,提高整個行業的研發效率。接下來,探序將通過與大型藥企聯合開發、為藥企/科研機構提供有價值的早期資產等多種方式,進行商業化。希望通過IntelliFold的應用和持續升級,系統提升新葯早期研發的成功率,從而改變新葯研發「10年周期、10億美元、10%成功率」的困境。

「通過AI,像設計芯片一樣設計蛋白質和藥物,」黃仁勛的這一理念在美國已被廣為接受。隨着AI的應用,臨牀前和處於臨牀一期的藥物資產價值,目前也正在面臨重估。因為AI的介入,這些早期資產的成藥概率大大增加。諾華全球CEO瓦斯·納拉辛漢也曾表示,希望看到AI等新技術能將藥物研發的成功率,從現在的1/10提升到2/10、甚至3/10。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。