繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

國金醫藥甘壇煥丨創新葯前瞻:從數據、算力、模型切入的3類龍頭,看全球AI製藥全景圖

2025-08-29 07:41

(來源:國金證券研究所)

摘要

基本邏輯

  時點:AI應用從構想到現實,多組學開發降本增效1000倍,首個AI重磅藥破殼在即。(1)時間到:人類對AI的想法,始於1950年的圖靈測試。隨着2016年DeepMind的Alphago擊敗世界圍棋冠軍,到2024年Hassabis和Jumper因為Alphafold2蛋白質結構的成功預測獲得諾貝爾化學獎,AI製藥的時代就已經開啟。(2)質變在即:根據專注於投資顛覆性技術的Ark Invest發佈的《Big Idea 2025》,生物醫藥領域正在發生着顛覆級的量變。多組學AI應用將帶來醫藥領域的1000倍降本增效。創新葯的超摩爾定律時代開啟。(3)問題已解:AI模型,黑箱已破。任何科學研究,包括創新葯研發在內,不論是體外還是人體臨牀試驗的可複製、可驗證性都是極為重要的。歐盟《人工智能法案》將使那些依賴黑箱模型、缺乏可解釋性的AI藥物發現系統出局。而龍頭AI藥企已經走出概念驗證。英矽智能,TNIK、ENPP1、PHD同路徑3次復現成功推進,AI研發過程都在Nature雜誌上詳細披露。

  本質:算力雲端接入、數據量質侷限皆獲破圍、模型隨時間增厚壁壘,創新研發回報率回升提速。(1)算力,是AI應用運行的前提。全球科技巨頭,包括亞馬遜、谷歌、微軟、阿里等,有充足的雲端算力可供藥企選擇。而英偉達,2025年8月22日推出 NVIDIA Spectrum-XGS 以太網,這是一項跨規模技術,用於將分佈式數據中心組合成統一的千兆級AI超級工廠。此舉將再提升全球算力量級。(2)數據:從DL(深度學習)到FL(聯邦學習),MNC(跨國巨頭)強強聯合,數據繭房被衝破。一方面,自從2016年谷歌推出了 FL至今,該技術受到廣泛關注。這種算法旨在建立更好的模型,並由多個方面驅動,包括在一組設備之間分散學習過程的好處(跨設備FL)、訪問廣泛分佈的知識(跨孤島FL)以及保護本地數據的隱私。另一方面,Apheris這類企業以及英國政府等,都在整合跨界協作以突破AI驅動藥物發現的數據侷限。根據英國政府官網2025年6月9日的新聞發佈,英國「OpenBind」聯盟當日宣佈,將利用突破性實驗技術,生成全球最大的藥物與蛋白質(人體的組成部分)相互作用數據集合。(3)模型是制勝關鍵。生成式AI藥企,從假設到實現,構建隨時間增長的領先模型壁壘是要點。當算力與數據不構成太大掣肘,模型開發迭代進化的效率與訓練經驗積累的先機就至關重要。與大藥企合作AI研發過程中的數據與模型構建正反饋飛輪,就將成就目前領先企業的護城河。

  行業變局:科技巨頭入局,產業鏈企業加速配置;十大製藥巨頭,AI佈局,無一缺席。(1)科技巨頭:英偉達,推BioNeMo、廣投AI藥企。谷歌,併購DeepMind拆分Isophormic Labs,后者在7月公開表示,臨牀試驗已經「非常接近」了。科技巨頭紛紛投入AI製藥。(2)產業鏈:泓博醫藥推DiOrion平臺,深度智耀賦能IND(新葯臨牀申請)合規提交,英矽智能從猜想、分子、臨牀到發佈全貫通。(3)製藥巨頭:默沙東、輝瑞、禮來、BMS等頭部藥企,數百億美元佈局AI製藥相關公司。從醫藥魔方統計的全球AIDD(AI藥物研發)相關交易首付額和總額Top 20的項目來看,重大交易集中發生在近5年內,總額超過500億美元。

投資策略

  綜上,我們認為,(1)AI新葯破局在即,首選管線豐富、兑現力強者。隨着AI製藥行業奇點來臨,首個重要時點,必然是人類首個AI驅動研發的藥物的獲批上市;換言之,不論模型還是數據更優,首個驗證的重磅藥纔將是焦點。因此,我們建議關注英矽智能、晶泰控股等已經有自研管線或合作項目進入臨牀階段的賽道龍頭。(2)製藥與跨界企業入局者眾,優選壁壘隨時間增厚者。因為AI製藥本身是科技跨界的嶄新賽道,未來的首個破局者,即可能是AI藥企,也可能是傳統仿創龍頭在AI領域前瞻深耕者,還可能是非藥領域的新進科技公司。因此,我們建議關注石藥集團、復星醫藥等在AI領域長期前瞻佈局的公司收穫相關成果的高彈性可能。

風險提示

  國際化相關的匯兌風險、國內外政策波動風險、投融資周期波動風險以及併購整合不達預期等風險。

+

目錄

  一、時點:AI應用從構想到現實,多組學開發降本增效千倍,首個AI重磅藥破殼在即

  1.1 時間到:從構想到現實,圖靈測試、Alphago到Alphafold與諾貝爾化學獎,AI製藥未來已來

  1.2 質變在即:顛覆級量變,多組學AI應用將1000倍降本增效,創新葯超摩爾定律時代開啟

  1.3 問題已解:AI模型,黑箱已破;英矽智能,TNIK、ENPP1、PHD同路徑3次復現成功推進

  二、本質:算力雲端接入、數據量質侷限皆獲破圍、模型隨時間增厚壁壘,創新研發回報率回升提速

  2.1 算力:亞馬遜、谷歌、微軟、阿里等,雲端供給充裕;英偉達,Spectrum-XGS燃爆算力量級

  2.2 數據:從DL(深度學習)到FL(聯邦學習),MNC(跨國巨頭)強強聯合,數據繭房被衝破

  2.3 模型:生成式AI藥企,從假設到實現,構建隨時間增長的領先模型壁壘

  三、行業變局:科技巨頭入局,產業鏈企業加速配置;十大製藥巨頭,AI佈局,無一缺席

  3.1 科技巨頭:英偉達,推BioNeMo、廣投AI藥企;谷歌,併購DeepMind拆分Isophormic Labs

  3.2 產業鏈:泓博醫藥推DiOrion,深度智耀賦能IND合規提交,英矽智能猜想、分子、臨牀與發佈全貫通

  3.3 製藥巨頭:默沙東、輝瑞、禮來、BMS等Top 10跨國藥企,數百億美元佈局AI製藥相關公司

四、投資策略

4.1 策略1:AI新葯破局在即,首選管線豐富、兑現力強者

4.2 策略2:製藥與跨界企業入局者眾,優選壁壘隨時間增厚者

五、風險提示

附錄

正文

  一、時點:AI應用從構想到現實,多組學開發降本增效千倍,首個AI重磅藥破殼在即

  1.1 時間到:從構想到現實,圖靈測試、Alphago到Alphafold與諾貝爾化學獎,AI製藥未來已來

  從1950年艾倫·圖靈的論文《計算機器與智能》提出能夠表現出智能行為的「通用機器」的概念,再到2016年DeepMind開發的 AlphaGo 擊敗了世界圍棋冠軍李世石、2024年Hassabis與Jumper因精準預測蛋白質結構的AlphaFold2獲得2024年諾貝爾化學獎,AI對全球所有的行業的發展軌跡都發生着顛覆性的影響。醫藥行業亦是如此。一邊是顛覆性科技在新葯研發與臨牀推進上快速發展,一邊是全球製藥巨頭面臨上一代重磅藥的專利懸崖到來,AI應用在全球創新葯唯快不破的大格局下,必將扮演重要角色。

  海外醫藥監管AI相關變化:根據美國NIH(美國國立健康研究院)發文,人工智能 (AI) 和機器學習 (ML) 代表着計算領域的重大進步,它們建立在人類數百萬年來發展的技術之上——從算盤到量子計算機。這些工具的發展已到達關鍵時刻。僅在 2021 年,美國食品藥品監督管理局 (FDA) 就收到了 100 多份產品註冊申請,這些申請嚴重依賴 AI/ML 來實現諸如監控和提升人類編制檔案效率等應用。爲了確保 AI/ML 在藥物研發和生產中的安全有效使用,FDA 和許多其他美國聯邦機構發佈了持續更新的嚴格指南;其首要目標是加快藥物研發,增強現有藥物的安全性,引入新的治療模式,並提高生產的合規性和穩健性。

  AI行業新爆點不斷:本周,在2025 Hot Chips會議前夕,英偉達正式推出Spectrum-XGS以太網技術。這一基於網絡優化算法的創新方案,通過引入「跨域擴展(scale-across)」能力,突破了單數據中心的電力、空間物理限制,可將分佈在不同城市、國家的多個數據中心連接成一個統一的「AI超級工廠」,為更大規模的AI工作負載,尤其是智能體AI(agentic AI)提供底層基礎設施支撐。

  1.2 質變在即:顛覆級量變,多組學AI應用將1000倍降本增效,創新葯超摩爾定律時代開啟

  根據全球Ark Invest發佈《Big Ideas 2025》,這份長達148頁的報告顯示,AI、機器人技術、能源存儲、公共區塊鏈和多組學測序將推動世界經濟指數級增長;其中,生物醫藥相關的多組學佔據18頁內容,成為篇幅最多的細分領域。

  根據智藥局發文,「木頭姐」(Cathie Wood)創立的Ark Invest,是專注於投資顛覆性技術的知名機構,資產管理規模達302億美元,其每年發佈的「Big Ideas」報告已成為全球投資者瞭解前沿科技和市場趨勢的重要文件。

  報告指出,利用AI來處理數據將顛覆診斷、藥物發現和治療,到2030年,整個行業的表現將提升幾個數量級。

  具體來看,AI將徹底改變多組學工具、藥物研發、分子診斷,並顯著改善藥物的經濟回報,如:AI將使DNA等生物信息的讀取和寫入成本分別降低100倍和1000倍;AI將使藥物開發成本降低4倍,並將研發投入的回報提高5倍;AI將使癌症篩查的效率提高20倍,並且將市場規模擴大10倍;AI藥物的商業價值將比標準藥物高20倍,比同類最佳的精準藥物高2.4倍。

  根據智藥局發文,木頭姐在后來接受採訪時進一步表示,AI賦能醫療保健的潛力被大大低估,從長遠來看,醫療保健將成為AI最為深遠的應用領域。進入2025年,已有甲骨文CEO拉里·埃里森、DeepMind CEO德米斯·哈薩比斯等多位科技界大佬公開看好AI在生物學的前景,醫療健康領域正在經歷一場前所未有的變革。

  Ark Invest將生物信息分為三個層次:序列—結構—系統。對第一層基因序列的解讀,以Illumina、Oxford Nanopore等企業對DNA/蛋白質測序領先。對第二層蛋白質結構的分析,目前AI相關的應用以DeepMind及其拆分成立的Isomorphic Lab等領先。對第三層生物系統的理解,則是10X Genomics、Akoya、Scalebio及Vizgen等單細胞測序龍頭領先。

  報告顯示,35年來,DNA測序成本下降了100億倍、DNA合成成本下降了10萬倍,比摩爾定律還要快得多。對人類基因組的計算時間已經從2001年的180天縮短到現在的10分鍾,當時分析單個基因組所花費的成本如今可以分析14億個基因組。

  例如,全球最大的公開基因組數據庫——英國生物數據庫,儲存着50萬名患者的信息,這個數據量是Meta開發的開源大語言模型LLaMA 3.1 405B的27倍。

  隨着測序技術的大規模應用,Ark Invest預計,未來生物數據量將激增1000倍甚至更多。

  1.3 問題已解:AI模型,黑箱已破;英矽智能,TNIK、ENPP1、PHD同路徑3次復現成功推進

  任何科學研究,包括創新葯研發在內,不論是體外還是人體臨牀試驗的可複製、可驗證性都是極為重要的。根據醫藥速覽發文,隨着2025年到來,AI製藥領域將迎來關鍵轉折點。一方面,AI技術在藥物研發中的應用已經從概念驗證階段邁向了實質性突破。例如,英矽智能Insilico Medicine通過遷移到Amazon SageMaker平臺,將新模型的迭代和部署時間從50天縮短至3天,加速比超過16倍。另一方面,監管環境的變化,特別是歐盟《人工智能法案》針對「不可接受風險」AI系統的禁令於2025年2月2日正式適用,意味着那些依賴黑箱模型、缺乏可解釋性的AI藥物發現系統,可能被迫退出歐洲市場,為AI製藥的發展帶來了新的挑戰和機遇。

  根據英矽智能招股書披露,公司通過其一體化生成式AI平臺Pharma.AI針對小分子及生物藥實現端到端的靶點發現、分子生成以及臨牀試驗的優化。這個平臺主要有Biology42 、Chemistry 42、Medicine 42以及Science42組成。

  Biology42平臺,由多個應用程序組成,包括PandaOmics、Generative Biologics等。PandaOmics是專為發現治療靶點及生物標誌物而設計的強大生成式AI,包括20多個模型,結合生成式AI技術及人類專家驗證。

  Chemistry42平臺,由Generative Chemistry、Golden Cubes、ADMET(吸收、分佈、代謝、排泄和毒性)Profiling等組成,用於優化生成的分子結構特性,有40多個AI模型通過廣泛的深度學習過程構建。公司已經開放超過300個AI模型,並通過測試和驗證將模型數量縮窄至僅超過40個已驗證的AI模型供Generative Chemistry使用。

  Medicine42平臺,則是由inClinico應用程序組成。inClinico是一款多引擎、生成式AI臨牀試驗分析應用程序,旨在預測II期向III期臨牀試驗轉換的結果。inClinico的預測準確性已經通過前瞻性研究驗證。

  Science42平臺,是一個新引進的平臺,具有DORA(研究撰寫助手)功能,是一種簡化起草學術論文和其他相關文件的過程的AI驅動工具。DORA通過利用AI帶來協助文獻綜述、假設產生和數據解釋以增強研究能力,最終加快科學發現的步伐。

  公司分別於2024年和2025年在Nature雜誌公開發表了TNIK、ENPP1和PHD等靶點藥物的AI研發過程。

  下圖為英矽智能於2024年3月在Nature Biotechnology發表的文章中披露的TNIK抑制劑的AI研發過程。通過a、b、c步驟,進行靶點發現、分子生成與篩選及優化、再預測篩選優化的臨牀方案。

  下圖為英矽智能於2025年5月23日在Nature Communication發表的文章中披露的口服ENPP1抑制劑的AI研發過程。

  二、本質:算力雲端接入、數據量質侷限皆獲破圍、模型隨時間增厚壁壘,創新研發回報率回升提速

  2.1 算力:亞馬遜、谷歌、微軟、阿里等,雲端供給充裕;英偉達,Spectrum-XGS燃爆算力量級

  AI製藥的推進,算力是基礎;不但因為雲算力的普及而不構成瓶頸,還由於英偉達等硬件巨頭的飛速創新而將獲得更高效進展。

  AI製藥所需算力充足:雲算力,是AI製藥行業的主流選擇。根據位於硅谷的直覺實驗室,在2025年4月最新發布,目前製藥公司正在轉向雲端算力,以利用數據和人工智能、加速流程、控制成本、促進協作、持續創新並增強韌性。這些驅動因素與行業更廣泛的數字化轉型目標相一致——雲計算是製藥公司實現數據驅動和以患者為中心的戰略的基礎。正如德勤所指出的,雲計算的最大價值不僅來自於 IT 成本優化,還來自於實現業務創新和敏捷性。那些有效利用這些驅動因素的公司——不僅僅是簡單地遷移服務器,而是在雲端重塑工作流程——正在研發效率、節省時間和解鎖新功能方面獲得巨大收益。以下是製藥行業雲遷移趨勢背后的一些關鍵驅動因素:

  1、數據量激增,高級分析需求激增:現代製藥企業需要處理海量數據,包括來自研究的組學數據、高分辨率成像、電子健康記錄、真實世界證據、來自制造設備的物聯網傳感器數據等等。傳統的本地部署難以高效地存儲和分析此類大數據。雲平臺提供幾乎無限的存儲空間和可擴展的計算集羣,可用於進行分析。這對於基因組學(每次實驗可產生數 TB 的數據)和藥物警戒(從大型數據庫中挖掘安全信號)等活動至關重要。此外,人工智能 (AI) 和機器學習在藥物研發和個性化醫療領域的興起,也是雲計算的巨大驅動力:訓練機器學習模型需要強大的計算能力,而云 GPU/TPU 實例可以按需提供這些計算能力。預計到 2025 年,全球數據生成量將飆升至 180 ZB——製藥業對這股數據洪流貢獻了巨大的力量,而基於雲的數據湖和分析工具正日益成為從這些海量數據集中獲取洞察的唯一實用方法。能夠在雲端運行復雜的分析和人工智能工作負載,並在需要時快速擴展,無疑是製藥業採用雲技術的最大技術驅動力。

  2、速度、敏捷性和上市時間:在製藥行業,研發和產品發佈的時間表至關重要。雲計算可以顯著提高IT運營速度,進而加快研究和決策速度。例如,為項目設置新的本地服務器可能需要數周的採購和安裝時間,而在雲中,只需幾分鍾即可配置新的環境。這種敏捷性意味着研究人員和項目團隊無需等待IT基礎設施——他們可以更快地進行原型設計和迭代。Moderna在雲支持下快速開發COVID-19疫苗的案例(過去需要數月,現在只需數周即可完成)說明了雲如何縮短關鍵項目的上市時間。藥企高管們將雲計算視為一種獲得競爭優勢的方式,通過改進協作和簡化流程,更快地將療法推向市場。

  3、成本效益和可擴展性: 成本是製藥公司雲決策中一個微妙的驅動因素。一方面,製藥公司擁有龐大的資本預算和現有的數據中心,因此成本並非遷移到雲的唯一初衷(尤其是在製藥行業利潤率較高的情況下)。然而,雲計算將IT支出從資本支出(購買硬件)轉變為運營支出(按需付費),這對於管理預算和根據實際需求調整成本具有吸引力。許多公司發現,對於不斷變化的工作負載,雲更經濟實惠——無需為閒置服務器付費,並且可以在高峰使用后縮減環境規模。據埃森哲估計,在某些情況下,遷移到公共雲可將總擁有成本降低高達 40%。此外,雲提供商受益於規模經濟,通常使商用計算和存儲成本低於本地解決方案。需要注意的是,成本並不總是較低——如果雲管理不善,成本可能會飆升——但總體而言,高效擴展的保障(需求增加時橫向擴展,縱向擴展以避免浪費)是一個重要的驅動因素。雲還減少了「以防萬一」而維持過剩容量的需要——使 IT 團隊無需不斷升級硬件。實際上,許多製藥公司正在將雲計算相關的節省資金重新投資於新的數字化項目,從而形成良性循環,推動雲計算的進一步應用。

  4、協作和全球訪問:製藥研發和業務運營是全球性的,涉及研究站點、臨牀研究人員、製造站點和商業團隊之間的跨境協作。雲計算提供了一個可從任何地方訪問的統一平臺,從而大大增強了協作。來自不同國家的研究人員可以在共享的雲工作區中協同工作,訪問相同的數據和工具,而無需在同一個公司網絡上。在監管提交期間,全球團隊可以同時處理基於雲的系統中的文件。隨着行業越來越重視外部合作(與生物技術初創公司、學術實驗室、合同研究組織等),雲已成為一個集成層,允許與外部合作伙伴安全地共享數據,而無需開放內部防火牆。

  5、創新與新技術(人工智能/機器學習、物聯網、GenAI):雲環境是快速創新的沃土,因為它們提供了快速獲取新技術的途徑。主要的雲提供商不斷推出尖端服務(例如,託管機器學習平臺、物聯網框架、區塊鏈即服務,以及最近的生成式人工智能服務)。製藥公司正在採用雲技術,以便能夠利用這些創新,而無需從頭開始構建。例如,如果一家公司想要嘗試生成式人工智能(探索 GenAI 概念驗證)進行分子設計或醫學寫作,他們可以利用雲提供商的 GPU 集羣和大型語言模型 API,而不必採購昂貴的硬件並自行構建模型。事實上,調查顯示,利用人工智能的能力如今已成為企業增加雲投資的主要原因之一。在製藥行業,這意味着利用人工智能進行藥物研發(如前所述),或使用高級分析進行個性化營銷——所有這些都由雲託管的人工智能服務實現。簡而言之,雲是通往快速創新的大門——製藥公司將其視為一個平臺,使其能夠更快地部署下一代解決方案(人工智能、數據科學、數字健康應用程序),並跟上技術變革的步伐。

  6、可靠性、災難恢復和安全態勢提升:儘管安全曾被視為雲計算的障礙,但如今許多公司意識到,領先的雲提供商在安全性和可靠性方面投入巨資,通常比單家公司單打獨鬥的投入還要多。(1)製藥業務(無論是研發系統還是生產基地的IT系統)的宕機成本可能非常高昂。雲基礎設施分佈在多個數據中心,並具備冗余功能,與單個本地數據中心相比,可以提供更長的正常運行時間和更快的災難恢復速度。(2)從安全角度來看,頂級雲提供商擁有大批安全專家、先進的威脅檢測和合規性認證(HIPAA、GxP 等),可以幫助製藥公司滿足監管安全要求。許多公司發現,相比更新舊的本地系統,遷移到雲端可以更有效地實現安全現代化(零信任架構、更完善的身份管理、靜態和傳輸加密)。由於看到證據表明雲可以減少停機時間和安全事故,高管們越來越信任將關鍵任務系統遷移到雲端。

  7、監管靈活性和可擴展性:製藥行業監管嚴格,這導致企業過去不願頻繁更改IT系統。

  AI製藥所需算力,提供商成熟:根據Clinked.com等網站發佈,2025 年全球6大雲提供商為亞馬遜網絡服務(AWS)、微軟Azure、谷歌雲、IBM雲、甲骨文和阿里雲。

  亞馬遜目前是全球領先者,佔據着全球約30%的市場份額,並且在可預見的未來仍將保持領先地位,因為目前還沒有人能夠超越它。與許多在各自行業中處於世界領先地位的公司一樣,亞馬遜公司是第一個利用其亞馬遜網絡服務(AWS)產品抓住雲計算機遇的公司。這使得它成為大型和小型公司從數據中心遷移到雲計算時的首選。

  AI製藥所需算力,還有更高效空間可以提升:2025年8月22日英偉達官網發佈,公司推出 NVIDIA Spectrum-XGS 以太網,這是一項跨規模技術,用於將分佈式數據中心組合成統一的千兆級 AI 超級工廠。

  隨着人工智能需求的激增,單個數據中心的功率和容量已達到極限。爲了實現擴展,數據中心必須擴展到任何一棟建築之外,而這受限於現成的以太網網絡基礎設施,這些基礎設施具有高延迟、抖動和不可預測的性能。

  Spectrum-XGS 以太網是NVIDIA Spectrum-X 以太網平臺的突破性產品,通過引入跨平臺擴展的基礎架構,打破了這些界限。它是 AI 計算超越縱向擴展和橫向擴展的第三大支柱,旨在擴展 Spectrum-X 以太網的極致性能和規模,以連接多個分佈式數據中心,形成具有千兆級智能能力的海量 AI 超級工廠。

  Spectrum-XGS 以太網完全集成到 Spectrum-X 平臺中,其特點是採用可動態調整網絡以適應數據中心設施之間距離的算法。Spectrum-XGS 以太網具備先進的自動調整距離擁塞控制、精確延迟管理和端到端遙測功能,幾乎使NVIDIA 集體通信庫 (Collective Communications Library)的性能提升了一倍,從而加速了多 GPU 和多節點通信,從而在地理分佈的 AI 集羣中提供可預測的性能。因此,多個數據中心可以作為單個 AI 超級工廠運行,並針對長距離連接進行了全面優化。

  採用新基礎設施的超大規模領先企業,包括 CoreWeave,它將率先將其數據中心與 Spectrum-XGS 以太網連接起來。CoreWeave 聯合創始人兼首席技術官 Peter Salanki 表示:「CoreWeave 的使命是為世界各地的創新者提供最強大的 AI 基礎架構。藉助 NVIDIA Spectrum-XGS,我們可以將數據中心連接到一臺統一的超級計算機,讓我們的客户能夠訪問千兆級 AI,從而加速各行各業的突破。」

  Spectrum-X 以太網網絡平臺為多租户、超大規模 AI 工廠(包括全球最大的 AI 超級計算機)提供比現成以太網更高的帶寬密度。它由 NVIDIA Spectrum-X 交換機和NVIDIA ConnectX -8 超級網卡組成,為構建 AI 未來的企業提供無縫的可擴展性、超低延迟和突破性的性能。

  此次公告是在 NVIDIA 宣佈一系列網絡創新之后發佈的,其中包括NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光子網絡交換機,這些交換機使 AI 工廠能夠跨站點連接數百萬個 GPU,同時降低能耗和運營成本。

  2.2 數據:從DL(深度學習)到FL(聯邦學習),MNC(跨國巨頭)強強聯合,數據繭房被衝破

  問題:數據不足與數據繭房。數據,是AI製藥研發的基礎資源,而AI在科學研究中面臨的一個主要挑戰是確保獲得充足的高質量數據,以開發有效的模型。儘管公共數據豐富,但最有價值的知識往往仍隱藏在企業機密的數據孤島中。儘管各行各業越來越願意分享非競爭性見解,但這種合作往往受到底層數據機密性的制約。

  根據Nature雜誌2025年3月的報道,Alphafold 正面臨藥物數據短缺的問題。這是一款用於預測蛋白質結構的革命性諾貝爾獎獲獎工具,但它存在一個問題:數據不足。

  最新版本的 AlphaFold 3 被譽為藥物發現的遊戲規則改變者,因為它可以模擬蛋白質與其他分子(包括藥物)的相互作用。但科學家表示, AlphaFold 的基礎數據(數十萬種公開的蛋白質結構)中缺乏這些相互作用的例子,這阻礙了該工具在此類應用的推進。

  AlphaFold能夠根據蛋白質序列預測其 3D 形狀,這依賴於 PDB(蛋白質數據庫) 中海量的蛋白質結構圖譜的獲取,這些結構圖譜是通過 X 射線晶體學等實驗方法繪製的。

  解決1:FL(聯邦學習)算法創新,既保護數據隱私安全,又共享更多高質量數據;國際藥企巨頭強強聯合,提效AI藥物研發。

  AI解決科學問題方面的主要力量在於它能夠通過從實驗觀察中挖掘因果模式來從數據中提取知識。這種形式的數字知識用於構建強大的預測模型,並已成為現代科學工具包的核心組成部分。例如,通過分析大量醫學肺部圖像,AI算法就能確定了照片特徵與患者被診斷出患有癌症的概率之間的因果關係。

  由於企業或個人的保密要求,數據的私有性已成為利用新人工智能工具的主要瓶頸,並限制了其效益。解鎖嵌入在私有數據中的知識將顯著增強人工智能的影響力,併爲新一代具有更高性能和更廣泛適用領域的預測模型開闢道路。這一觀點引發了FL(聯邦學習)領域的深入研究。

  2016年,谷歌推出了 FL,此后在人工智能領域引起了廣泛關注。這項研究工作旨在建立更好的模型,並由多個方面驅動,包括在一組設備之間分散學習過程的好處(跨設備 FL) 、訪問廣泛分佈的知識(跨孤島 FL)以及保護本地數據的隱私。目前,採用最多的 FL 方法是模型驅動。

  它基於一個在非本地站點進行訓練的中央模型。通過本地模型訓練在每個站點提取知識,並通過安全網絡通信將參數更新聯合到中央模型中。中央模型成為聯合知識的接收者,參數更新將知識從本地站點傳遞到中央模型(見下圖)。由於只共享模型參數,因此該方法提供了良好的隱私保護。

  MD-FL(模型驅動FL),中心模型使用本地私有數據以非本地化的方式進行訓練;知識通過本地權重更新來傳達。權重更新在中心模型中聚合。

  DD-FL (數據驅動FL),依賴於中心公共數據集;知識通過本地私有模型預測的標籤來傳達。每個公共實例的標籤集合都整合到中心數據集中。

  解決2:產業鏈內跨領域合作,Apheris等整合跨界協作以突破AI驅動的藥物發現的侷限。

  根據PWC普華永道2024年關於數據驅動未來研發的報告,如果沒有協作,AI和數據驅動的轉型幾乎不可能成功。

  以個性化精準醫療為例:一個健康人的基因組和其他生物學特徵(例如蛋白質組和代謝組)會被數字化測序和存儲。然后,她的醫生可以訪問這些數據,將其作為預防保健或疾病診斷的一部分。

  如果確定了風險因素,就會為該人量身定製一種活性成分。但關鍵問題是:活性成分的生產商,即製藥公司,如何獲取個人特徵和風險因素,從而開發新的活性成分?

  在一個全面的「健康化身」中集中記錄和存儲這些特徵似乎很有意義,因為它可以簡化上述許多流程。然而,也存在一些挑戰,包括隱私問題。個人醫療數據是一項非常值得保護的資產。其他障礙包括極高的數據存儲量和成本(見下圖)。

  例如,750 MB 可能足以存儲單個基因組,但存儲單個人的 X-Omics 數據已佔用數 TB 級空間。如果加上現實世界數據的存儲,則達到 PB 級,而按世界人口計算,則達到 EB 級。因此,此類數據存儲需要投入巨大的精力和成本。此外,製藥公司現在有時與大型科技公司競爭,后者正在與醫院和衞生組織建立合作伙伴關係。

  然而,儘管面臨這些重大挑戰,系統地收集和分析個人醫療數據以開發新的活性物質和治療方法的必要性是毋庸置疑的。公司可以邁出第一步,開放和共享部分自身數據。他們還可以與數據聚合器和服務提供商合作;通過研究和聯合研究中心與醫院合作;與診斷公司合作;以及與自行收集健康和患者數據的科技公司合作。此外,跨公司健康數據交換聯盟正在建立。分子測序數據由商業和非商業工具提供。

  諸如Apheris 等全球領先的的聯合生命科學數據網絡提供商,正在着手解決這個問題。隨着FL(聯邦學習)相關探索的上升,製藥產業鏈內的跨領域合作正在推進。

  解決3:政府主導數據整合,英國政府推出OpenBind開放數據集;我們預判,這只是各國政府推動AI製藥進步的一個開始。

  根據英國政府官網2025年6月9日的新聞發佈,英國「OpenBind」聯盟當日宣佈,將利用突破性實驗技術,生成全球最大的藥物與蛋白質(人體的組成部分)相互作用數據集合。

  新的 OpenBind 聯盟將使英國成為人工智能驅動的藥物發現領域的領導者——將藥物發現和開發的成本削減高達 1000 億英鎊。

  OpenBind 將創建史上最大的、經過實驗驗證的藥物-蛋白質相互作用開放數據集。這將彌補醫藥研發領域長期存在的一個空白:缺乏將小分子與其結合的蛋白質關聯起來的高質量、大規模數據集。這些數據集對於訓練用於早期藥物設計的 高質量AI模型至關重要。

  OpenBind 將部署自動化化學和高通量 X 射線晶體學技術,最終在 5 年內生成超過 50 萬個蛋白質-配體複合物結構和親和力測量數據。這將使過去半個世紀以來所有公共數據的數量增加 20 倍,填補數據生態系統中阻礙現代生成模型開發和評估的關鍵空白。

  OpenBind 提供了一個基礎數據集,將支撐多個技術領域的進步,包括結構預測、生成式分子設計、分子對接和主動學習工作流程。它旨在與其他新興方法協同工作,以幫助減少反覆試驗,為候選化合物的選擇提供參考,並支持更系統地探索化學空間。

  2.3 模型:生成式AI藥企,從假設到實現,構建隨時間增長的領先模型壁壘

  綜上所述,AI製藥三要素中的數據與算力,目前並不構成相關藥企的太大掣肘;那麼,模型開發迭代進化的效率與訓練經驗積累的先機,就將成為目前領先企業的護城河。根據Biopharma於2024年11月發佈的2025年展望分析,目前,全球領先的25家AI藥企如下圖。

  下圖顯示了 AI 目前在藥物研發流程中發揮重要作用,並有望顛覆傳統實驗技術的領域。AI 驅動型研發的巔峰是從頭設計,整個臨牀前流程可在計算機模擬中進行,從而節省數十億美元的研發成本,通過優化更安全、更易開發的分子,對精心挑選的靶點表現出強大的功效,從而降低藥物成本並提高臨牀成功率。

  根據美國NIH數據庫2025年2月報告顯示,雖然從頭設計尚未得到證實,但截至 2023 年 12 月,已完成 I 期試驗的 21 種 AI 開發藥物的成功率為 80% 至 90%,顯著高於傳統方法的 40% 左右。我們持續看到使用 AI 開發的候選藥物進入臨牀階段的數量呈指數級增長,從 2016 年的 3 種增加到 2020 年的 17 種,再到 2023 年的 67 種。

  跨生命科學模式(例如成像、多組學和超大型蛋白質組)的高質量數據訪問,與大型深度學習模型在擴展和架構方面的最新進展之間的交匯,推動了醫療保健領域人工智能應用的爆炸式增長。而該領域的龍頭企業中,有望隨着模型數據不斷交互進化的過程,而構建模型先機優勢。

  而模型優勢的驗證,也是投資者更關注的,就是全球首個AI研發的藥物花落誰家。我們認為,會發生在目前自研或合作臨牀開發管線較多的英矽智能、Recursion、晶泰控股這類AI藥企/CRO 或全球Top10的國際巨頭之中。

  下圖是我們對已經上市的AI藥企/CRO 龍頭公司的近4年收入與研發加回的歸母淨利潤的橫向對比。

  三、行業變局:科技巨頭入局,產業鏈企業加速配置;十大製藥巨頭,AI佈局,無一缺席

  3.1 科技巨頭:英偉達,推BioNeMo、廣投AI藥企;谷歌,併購DeepMind拆分Isophormic Labs

  隨着AI在醫藥領域應用的推進,科技巨頭也正日益深入地融入到AI製藥領域。AWS、英偉達、甲骨文等公司不再僅僅是基礎設施提供商,它們正在積極塑造製藥公司構建、購買和擴展人工智能解決方案的方式。

  下圖,為MarketandMarket分析報告所展示的AI製藥生態系統中的參與者(左圖)和市場空間(右圖)。

  英偉達,不但投資了十數家AI製藥企業,還在通過擴展的 AI 模型庫和靈活的部署選項,將生成式 AI 的力量賦能更多製藥和生物科技公司,助力其藥物研發。目前,已有 100 多家公司正在使用該公司的生物分子 BioNeMo 平臺來加速療法的開發。

  英偉達BioNeMo 框架是用於計算藥物發現的編程工具、庫和模型的集合。它通過提供特定領域的優化模型和工具,加速構建和調整生物分子 AI 中最耗時且成本最高的階段,這些模型和工具可以輕松集成到任何基於 GPU 的計算環境中。

  2024年3月,BioNeMo在 NVIDIA GTC大會上宣佈了最新功能,其中包括用於關鍵任務的全新基礎模型,例如分析 DNA 序列、預測蛋白質結構以及基於RNA數據確定細胞功能。這些模型現已通過 NVIDIA NIM(NVIDIA 推理微服務)以易於部署的微服務形式提供。NVIDIA NIM是一組雲原生微服務,旨在簡化生成式AI模型在生產環境中的部署。NIM支持使用行業標準API將AI流程集成到應用程序中,同時簡化AI模型開發的複雜性。

  BioNeMo 框架代碼庫採用子項目結構設計,方便用户貢獻代碼並集中精力。整個代碼庫可以作為一個整體安裝,也可以被拆分成可獨立安裝的組件,這些組件被稱為子項目,並根據其特定的用途和範圍進行組織。這種模塊化架構增強了可擴展性,允許新的貢獻以兩種形式進行:創建新的子項目(廣泛貢獻)或擴展現有子項目(深度貢獻)。

  BioNeMo的核心是bionemo-core,它提供了基於 PyTorch 和 Lightning 框架構建的基本接口、通用數據處理和模型構建塊。該核心依賴項支持框架內的所有其他子項目。例如,bionemo-llm子包基於NVIDIA的NeMo 和 Megatron 庫構建,提供針對生物的定製功能和基礎模型架構。bionemo-geometric 子包正在開發利用 PyTorch Geometric的圖神經網絡(GNN)支持,這凸顯了BioNeMo 生態系統中創新的廣度。

  特定的模型和數據加載器被封裝在其子包中,使用户能夠選擇性地僅添加與其特定用例相關的組件。這種模塊化設計不僅簡化了定製,還增強了可用性。

  爲了方便集成到私人項目中,BioNeMo子項目被設計託管在 Python包索引上(PyPI)。Docker 鏡像支持快速開發,允許用户快速搭建完整的開發環境。倉庫中的內置工具進一步幫助用户創建自己的 Python 項目並將其集成到工作流程中,從而簡化開發流程。

  BioNeMo框架目前支持通過NVIDIA NeMo Megatron構建基於BERT的大規模的模型。NVIDIA NeMo Megatron是一個可擴展的框架,用於開發自定義LLM、多模態和語音 AI。BioNeMo框架使用 NeMo Megatron構建生物分子BERT模型支持。

  2025年7月16日,英偉達又聯合加拿大魁北克人工智能研究所Mila,推出了一款全新AI+蛋白質基礎生成模型La-Proteina ,能夠生成全原子級別的蛋白質結構和序列。

  互聯網巨頭谷歌,在AI製藥領域最引人關注的,是他的英國子公司Deepmind旗下,於2021年拆分出來的AI製藥公司Isomorphic Labs。該公司 AI新葯臨牀在即。根據2025年7月7日英國健康科技世界官網報道,Isomorpic Labs的總裁兼Google DeepMind首席商務官科林·默多克 (Colin Murdoch) 表示,經過多年的開發,臨牀試驗已經「非常接近」了。

  2024 年,即發佈 AlphaFold 3 的同一年,Isomorphic Labs與製藥公司諾華和禮來簽署了重要研究合作協議。它支持現有的藥物項目,並在腫瘤學和免疫學等領域開發自己的內部候選藥物,目的是最終在早期試驗后獲得許可。我們認為,其與藥企巨頭的合作,能在執行項目的過程中,不斷反饋實驗數據,反哺模型精度,形成數據整合壁壘,構成「數據-模型」飛輪效應。

  2025 年 4 月,該公司在由風險投資公司 Thrive Capital 領投的首輪外部融資中籌集了 6 億美元。公司表示,他們正在通過將機器學習研究人員與製藥行業資深人士結合起來,打造一個「世界級的藥物設計引擎」,以更快、更經濟高效、更高成功率地設計新葯。

  3.2 產業鏈:泓博醫藥推DiOrion,深度智耀賦能IND合規提交,英矽智能猜想、分子、臨牀與發佈全貫通

  在中國,製藥產業鏈上下游也在紛紛引入AI應用。

  上游:CRO(研發外包服務)公司泓博醫藥於2025年1月在上海舉行了DiOrion平臺發佈會。深度智耀,則在2025年4月美國FDA 新一代電子遞交網關ESG NextGen將正式啟用后,早在2024年5月,深度智耀DEEP-PV系統即率先實現FDA E2B R3區域標準兼容,並基於自研的AI醫學翻譯引擎,構建了從原始數據提取、術語智能匹配到雙語報告生成的端到端解決方案。

  中游:AI製藥企業英矽智能,憑藉自建的Pharma.AI平臺實現了端到端全流程的AI應用,並有20多種臨牀候選化合物,其中10種已經獲批IND(新葯臨牀研究)。2023年6月,公司的TNIK候選藥物完成了臨牀IIa期的首例患者給藥。2025年7月,該候選藥物的2期臨牀數據在Nature雜誌發表,實現了AI製藥行業首個臨牀概念驗證案例。

  下游:2025年2月6日,AI醫療公司智雲健康宣佈將DeepSeek-R1模型接入公司自研醫療人工智能系統"智雲大腦"。這一舉措將增強智雲醫療大腦的數據挖掘能力,提高數字化慢病管理效率,進一步提升醫療AI新質生產力。

  3.3 製藥巨頭:默沙東、輝瑞、禮來、BMS等Top 10跨國藥企,數百億美元佈局AI製藥相關公司

  製藥巨頭理念轉變中。2025年7月,風投公司Define Venture發佈了製藥巨頭高管對AI觀點的調研報告。該報告基於對 40 多位製藥和技術領導者(包括前 20 家制藥公司中的 16 家,以及亞馬遜網絡服務、英偉達和甲骨文等大型科技公司)的採訪和調查顯示,AI已從孤立的試點轉變為一項戰略要務,在成本上升、利潤率收緊和法規不斷變化的情況下,其緊迫性日益增強。

  約85%的受訪企業領導者表示,他們正在加大對人工智能的投資,其中70%的企業將其視為當務之急。在排名前20的公司中,這一數字躍升至85%。

  報告指出,製藥行業在自主研發而非購買方面的思維模式發生了重大轉變。儘管該行業歷來傾向於自主研發AI工具,但目前只有30%的公司打算繼續沿用這種方式,另有40%的公司傾向於混合戰略,還有30%的公司現在優先考慮外部優先的解決方案。

  AI製藥相關BD爆發。從上圖insight數據庫統計的相關交易量來看,近8年發生了近百起(94起)。從下圖醫藥魔方統計的全球AIDD(AI藥物研發)相關交易首付額和總額Top 20的項目來看,重大交易集中發生在近5年內,總額超過500億美元。

四、投資策略

4.1 策略1:AI新葯破局在即,首選管線豐富、兑現力強者

  綜上所述,從AI藥企的角度,隨着AI製藥行業奇點來臨,首個重要時點,必然是人類首個AI驅動研發的藥物的獲批上市;換言之,不論模型還是數據更優,首個驗證的重磅藥纔將是焦點。因此,我們建議關注英矽智能、晶泰控股等已經有自研管線或合作項目進入臨牀階段的賽道龍頭。

4.2 策略2:製藥與跨界企業入局者眾,優選壁壘隨時間增厚者

  同時,因為AI製藥本身是科技跨界的嶄新賽道,未來的首個破局者,即可能是AI藥企,也可能是傳統仿創龍頭在AI領域前瞻深耕者,還可能是非藥領域的新進科技公司。因此,我們建議關注石藥集團、復星醫藥等在AI領域長期前瞻佈局的公司收穫相關成果的高彈性可能。

五、風險提示

  匯兌風險:部分公司海外業務佔比高,人民幣匯率的大幅波動可能會對公司利潤產生明顯影響。其程度依賴於匯率本身的波動,同時也取決於公司套期保值相關工具的使用和實施。

  國內外政策風險:若海外貿易摩擦導致產品出口出現障礙或海外原材料採購價格提升,將可能對部分公司業績增長產生影響。

  投融資周期波動風險:醫藥行業投融資水平對部分公司有較大影響,若全球醫藥投融資市場不夠活躍,將影響部分公司的業績表現。

  併購整合不及預期的風險:部分公司進行併購擴大業務佈局,如併購整合不能順利完成,可能影響公司整體業績表現。

附錄

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。