热门资讯> 正文
2025-08-29 07:41
(来源:国金证券研究所)
摘要
基本逻辑
时点:AI应用从构想到现实,多组学开发降本增效1000倍,首个AI重磅药破壳在即。(1)时间到:人类对AI的想法,始于1950年的图灵测试。随着2016年DeepMind的Alphago击败世界围棋冠军,到2024年Hassabis和Jumper因为Alphafold2蛋白质结构的成功预测获得诺贝尔化学奖,AI制药的时代就已经开启。(2)质变在即:根据专注于投资颠覆性技术的Ark Invest发布的《Big Idea 2025》,生物医药领域正在发生着颠覆级的量变。多组学AI应用将带来医药领域的1000倍降本增效。创新药的超摩尔定律时代开启。(3)问题已解:AI模型,黑箱已破。任何科学研究,包括创新药研发在内,不论是体外还是人体临床试验的可复制、可验证性都是极为重要的。欧盟《人工智能法案》将使那些依赖黑箱模型、缺乏可解释性的AI药物发现系统出局。而龙头AI药企已经走出概念验证。英矽智能,TNIK、ENPP1、PHD同路径3次复现成功推进,AI研发过程都在Nature杂志上详细披露。
本质:算力云端接入、数据量质局限皆获破围、模型随时间增厚壁垒,创新研发回报率回升提速。(1)算力,是AI应用运行的前提。全球科技巨头,包括亚马逊、谷歌、微软、阿里等,有充足的云端算力可供药企选择。而英伟达,2025年8月22日推出 NVIDIA Spectrum-XGS 以太网,这是一项跨规模技术,用于将分布式数据中心组合成统一的千兆级AI超级工厂。此举将再提升全球算力量级。(2)数据:从DL(深度学习)到FL(联邦学习),MNC(跨国巨头)强强联合,数据茧房被冲破。一方面,自从2016年谷歌推出了 FL至今,该技术受到广泛关注。这种算法旨在建立更好的模型,并由多个方面驱动,包括在一组设备之间分散学习过程的好处(跨设备FL)、访问广泛分布的知识(跨孤岛FL)以及保护本地数据的隐私。另一方面,Apheris这类企业以及英国政府等,都在整合跨界协作以突破AI驱动药物发现的数据局限。根据英国政府官网2025年6月9日的新闻发布,英国“OpenBind”联盟当日宣布,将利用突破性实验技术,生成全球最大的药物与蛋白质(人体的组成部分)相互作用数据集合。(3)模型是制胜关键。生成式AI药企,从假设到实现,构建随时间增长的领先模型壁垒是要点。当算力与数据不构成太大掣肘,模型开发迭代进化的效率与训练经验积累的先机就至关重要。与大药企合作AI研发过程中的数据与模型构建正反馈飞轮,就将成就目前领先企业的护城河。
行业变局:科技巨头入局,产业链企业加速配置;十大制药巨头,AI布局,无一缺席。(1)科技巨头:英伟达,推BioNeMo、广投AI药企。谷歌,并购DeepMind拆分Isophormic Labs,后者在7月公开表示,临床试验已经“非常接近”了。科技巨头纷纷投入AI制药。(2)产业链:泓博医药推DiOrion平台,深度智耀赋能IND(新药临床申请)合规提交,英矽智能从猜想、分子、临床到发布全贯通。(3)制药巨头:默沙东、辉瑞、礼来、BMS等头部药企,数百亿美元布局AI制药相关公司。从医药魔方统计的全球AIDD(AI药物研发)相关交易首付额和总额Top 20的项目来看,重大交易集中发生在近5年内,总额超过500亿美元。
投资策略
综上,我们认为,(1)AI新药破局在即,首选管线丰富、兑现力强者。随着AI制药行业奇点来临,首个重要时点,必然是人类首个AI驱动研发的药物的获批上市;换言之,不论模型还是数据更优,首个验证的重磅药才将是焦点。因此,我们建议关注英矽智能、晶泰控股等已经有自研管线或合作项目进入临床阶段的赛道龙头。(2)制药与跨界企业入局者众,优选壁垒随时间增厚者。因为AI制药本身是科技跨界的崭新赛道,未来的首个破局者,即可能是AI药企,也可能是传统仿创龙头在AI领域前瞻深耕者,还可能是非药领域的新进科技公司。因此,我们建议关注石药集团、复星医药等在AI领域长期前瞻布局的公司收获相关成果的高弹性可能。
风险提示
国际化相关的汇兑风险、国内外政策波动风险、投融资周期波动风险以及并购整合不达预期等风险。
+
目录
一、时点:AI应用从构想到现实,多组学开发降本增效千倍,首个AI重磅药破壳在即
1.1 时间到:从构想到现实,图灵测试、Alphago到Alphafold与诺贝尔化学奖,AI制药未来已来
1.2 质变在即:颠覆级量变,多组学AI应用将1000倍降本增效,创新药超摩尔定律时代开启
1.3 问题已解:AI模型,黑箱已破;英矽智能,TNIK、ENPP1、PHD同路径3次复现成功推进
二、本质:算力云端接入、数据量质局限皆获破围、模型随时间增厚壁垒,创新研发回报率回升提速
2.1 算力:亚马逊、谷歌、微软、阿里等,云端供给充裕;英伟达,Spectrum-XGS燃爆算力量级
2.2 数据:从DL(深度学习)到FL(联邦学习),MNC(跨国巨头)强强联合,数据茧房被冲破
2.3 模型:生成式AI药企,从假设到实现,构建随时间增长的领先模型壁垒
三、行业变局:科技巨头入局,产业链企业加速配置;十大制药巨头,AI布局,无一缺席
3.1 科技巨头:英伟达,推BioNeMo、广投AI药企;谷歌,并购DeepMind拆分Isophormic Labs
3.2 产业链:泓博医药推DiOrion,深度智耀赋能IND合规提交,英矽智能猜想、分子、临床与发布全贯通
3.3 制药巨头:默沙东、辉瑞、礼来、BMS等Top 10跨国药企,数百亿美元布局AI制药相关公司
四、投资策略
4.1 策略1:AI新药破局在即,首选管线丰富、兑现力强者
4.2 策略2:制药与跨界企业入局者众,优选壁垒随时间增厚者
五、风险提示
附录
正文
一、时点:AI应用从构想到现实,多组学开发降本增效千倍,首个AI重磅药破壳在即
1.1 时间到:从构想到现实,图灵测试、Alphago到Alphafold与诺贝尔化学奖,AI制药未来已来
从1950年艾伦·图灵的论文《计算机器与智能》提出能够表现出智能行为的“通用机器”的概念,再到2016年DeepMind开发的 AlphaGo 击败了世界围棋冠军李世石、2024年Hassabis与Jumper因精准预测蛋白质结构的AlphaFold2获得2024年诺贝尔化学奖,AI对全球所有的行业的发展轨迹都发生着颠覆性的影响。医药行业亦是如此。一边是颠覆性科技在新药研发与临床推进上快速发展,一边是全球制药巨头面临上一代重磅药的专利悬崖到来,AI应用在全球创新药唯快不破的大格局下,必将扮演重要角色。
海外医药监管AI相关变化:根据美国NIH(美国国立健康研究院)发文,人工智能 (AI) 和机器学习 (ML) 代表着计算领域的重大进步,它们建立在人类数百万年来发展的技术之上——从算盘到量子计算机。这些工具的发展已到达关键时刻。仅在 2021 年,美国食品药品监督管理局 (FDA) 就收到了 100 多份产品注册申请,这些申请严重依赖 AI/ML 来实现诸如监控和提升人类编制档案效率等应用。为了确保 AI/ML 在药物研发和生产中的安全有效使用,FDA 和许多其他美国联邦机构发布了持续更新的严格指南;其首要目标是加快药物研发,增强现有药物的安全性,引入新的治疗模式,并提高生产的合规性和稳健性。
AI行业新爆点不断:本周,在2025 Hot Chips会议前夕,英伟达正式推出Spectrum-XGS以太网技术。这一基于网络优化算法的创新方案,通过引入“跨域扩展(scale-across)”能力,突破了单数据中心的电力、空间物理限制,可将分布在不同城市、国家的多个数据中心连接成一个统一的“AI超级工厂”,为更大规模的AI工作负载,尤其是智能体AI(agentic AI)提供底层基础设施支撑。
1.2 质变在即:颠覆级量变,多组学AI应用将1000倍降本增效,创新药超摩尔定律时代开启
根据全球Ark Invest发布《Big Ideas 2025》,这份长达148页的报告显示,AI、机器人技术、能源存储、公共区块链和多组学测序将推动世界经济指数级增长;其中,生物医药相关的多组学占据18页内容,成为篇幅最多的细分领域。
根据智药局发文,“木头姐”(Cathie Wood)创立的Ark Invest,是专注于投资颠覆性技术的知名机构,资产管理规模达302亿美元,其每年发布的“Big Ideas”报告已成为全球投资者了解前沿科技和市场趋势的重要文件。
报告指出,利用AI来处理数据将颠覆诊断、药物发现和治疗,到2030年,整个行业的表现将提升几个数量级。
具体来看,AI将彻底改变多组学工具、药物研发、分子诊断,并显著改善药物的经济回报,如:AI将使DNA等生物信息的读取和写入成本分别降低100倍和1000倍;AI将使药物开发成本降低4倍,并将研发投入的回报提高5倍;AI将使癌症筛查的效率提高20倍,并且将市场规模扩大10倍;AI药物的商业价值将比标准药物高20倍,比同类最佳的精准药物高2.4倍。
根据智药局发文,木头姐在后来接受采访时进一步表示,AI赋能医疗保健的潜力被大大低估,从长远来看,医疗保健将成为AI最为深远的应用领域。进入2025年,已有甲骨文CEO拉里·埃里森、DeepMind CEO德米斯·哈萨比斯等多位科技界大佬公开看好AI在生物学的前景,医疗健康领域正在经历一场前所未有的变革。
Ark Invest将生物信息分为三个层次:序列—结构—系统。对第一层基因序列的解读,以Illumina、Oxford Nanopore等企业对DNA/蛋白质测序领先。对第二层蛋白质结构的分析,目前AI相关的应用以DeepMind及其拆分成立的Isomorphic Lab等领先。对第三层生物系统的理解,则是10X Genomics、Akoya、Scalebio及Vizgen等单细胞测序龙头领先。
报告显示,35年来,DNA测序成本下降了100亿倍、DNA合成成本下降了10万倍,比摩尔定律还要快得多。对人类基因组的计算时间已经从2001年的180天缩短到现在的10分钟,当时分析单个基因组所花费的成本如今可以分析14亿个基因组。
例如,全球最大的公开基因组数据库——英国生物数据库,储存着50万名患者的信息,这个数据量是Meta开发的开源大语言模型LLaMA 3.1 405B的27倍。
随着测序技术的大规模应用,Ark Invest预计,未来生物数据量将激增1000倍甚至更多。
1.3 问题已解:AI模型,黑箱已破;英矽智能,TNIK、ENPP1、PHD同路径3次复现成功推进
任何科学研究,包括创新药研发在内,不论是体外还是人体临床试验的可复制、可验证性都是极为重要的。根据医药速览发文,随着2025年到来,AI制药领域将迎来关键转折点。一方面,AI技术在药物研发中的应用已经从概念验证阶段迈向了实质性突破。例如,英矽智能Insilico Medicine通过迁移到Amazon SageMaker平台,将新模型的迭代和部署时间从50天缩短至3天,加速比超过16倍。另一方面,监管环境的变化,特别是欧盟《人工智能法案》针对“不可接受风险”AI系统的禁令于2025年2月2日正式适用,意味着那些依赖黑箱模型、缺乏可解释性的AI药物发现系统,可能被迫退出欧洲市场,为AI制药的发展带来了新的挑战和机遇。
根据英矽智能招股书披露,公司通过其一体化生成式AI平台Pharma.AI针对小分子及生物药实现端到端的靶点发现、分子生成以及临床试验的优化。这个平台主要有Biology42 、Chemistry 42、Medicine 42以及Science42组成。
Biology42平台,由多个应用程序组成,包括PandaOmics、Generative Biologics等。PandaOmics是专为发现治疗靶点及生物标志物而设计的强大生成式AI,包括20多个模型,结合生成式AI技术及人类专家验证。
Chemistry42平台,由Generative Chemistry、Golden Cubes、ADMET(吸收、分布、代谢、排泄和毒性)Profiling等组成,用于优化生成的分子结构特性,有40多个AI模型通过广泛的深度学习过程构建。公司已经开放超过300个AI模型,并通过测试和验证将模型数量缩窄至仅超过40个已验证的AI模型供Generative Chemistry使用。
Medicine42平台,则是由inClinico应用程序组成。inClinico是一款多引擎、生成式AI临床试验分析应用程序,旨在预测II期向III期临床试验转换的结果。inClinico的预测准确性已经通过前瞻性研究验证。
Science42平台,是一个新引进的平台,具有DORA(研究撰写助手)功能,是一种简化起草学术论文和其他相关文件的过程的AI驱动工具。DORA通过利用AI带来协助文献综述、假设产生和数据解释以增强研究能力,最终加快科学发现的步伐。
公司分别于2024年和2025年在Nature杂志公开发表了TNIK、ENPP1和PHD等靶点药物的AI研发过程。
下图为英矽智能于2024年3月在Nature Biotechnology发表的文章中披露的TNIK抑制剂的AI研发过程。通过a、b、c步骤,进行靶点发现、分子生成与筛选及优化、再预测筛选优化的临床方案。
下图为英矽智能于2025年5月23日在Nature Communication发表的文章中披露的口服ENPP1抑制剂的AI研发过程。
二、本质:算力云端接入、数据量质局限皆获破围、模型随时间增厚壁垒,创新研发回报率回升提速
2.1 算力:亚马逊、谷歌、微软、阿里等,云端供给充裕;英伟达,Spectrum-XGS燃爆算力量级
AI制药的推进,算力是基础;不但因为云算力的普及而不构成瓶颈,还由于英伟达等硬件巨头的飞速创新而将获得更高效进展。
AI制药所需算力充足:云算力,是AI制药行业的主流选择。根据位于硅谷的直觉实验室,在2025年4月最新发布,目前制药公司正在转向云端算力,以利用数据和人工智能、加速流程、控制成本、促进协作、持续创新并增强韧性。这些驱动因素与行业更广泛的数字化转型目标相一致——云计算是制药公司实现数据驱动和以患者为中心的战略的基础。正如德勤所指出的,云计算的最大价值不仅来自于 IT 成本优化,还来自于实现业务创新和敏捷性。那些有效利用这些驱动因素的公司——不仅仅是简单地迁移服务器,而是在云端重塑工作流程——正在研发效率、节省时间和解锁新功能方面获得巨大收益。以下是制药行业云迁移趋势背后的一些关键驱动因素:
1、数据量激增,高级分析需求激增:现代制药企业需要处理海量数据,包括来自研究的组学数据、高分辨率成像、电子健康记录、真实世界证据、来自制造设备的物联网传感器数据等等。传统的本地部署难以高效地存储和分析此类大数据。云平台提供几乎无限的存储空间和可扩展的计算集群,可用于进行分析。这对于基因组学(每次实验可产生数 TB 的数据)和药物警戒(从大型数据库中挖掘安全信号)等活动至关重要。此外,人工智能 (AI) 和机器学习在药物研发和个性化医疗领域的兴起,也是云计算的巨大驱动力:训练机器学习模型需要强大的计算能力,而云 GPU/TPU 实例可以按需提供这些计算能力。预计到 2025 年,全球数据生成量将飙升至 180 ZB——制药业对这股数据洪流贡献了巨大的力量,而基于云的数据湖和分析工具正日益成为从这些海量数据集中获取洞察的唯一实用方法。能够在云端运行复杂的分析和人工智能工作负载,并在需要时快速扩展,无疑是制药业采用云技术的最大技术驱动力。
2、速度、敏捷性和上市时间:在制药行业,研发和产品发布的时间表至关重要。云计算可以显著提高IT运营速度,进而加快研究和决策速度。例如,为项目设置新的本地服务器可能需要数周的采购和安装时间,而在云中,只需几分钟即可配置新的环境。这种敏捷性意味着研究人员和项目团队无需等待IT基础设施——他们可以更快地进行原型设计和迭代。Moderna在云支持下快速开发COVID-19疫苗的案例(过去需要数月,现在只需数周即可完成)说明了云如何缩短关键项目的上市时间。药企高管们将云计算视为一种获得竞争优势的方式,通过改进协作和简化流程,更快地将疗法推向市场。
3、成本效益和可扩展性: 成本是制药公司云决策中一个微妙的驱动因素。一方面,制药公司拥有庞大的资本预算和现有的数据中心,因此成本并非迁移到云的唯一初衷(尤其是在制药行业利润率较高的情况下)。然而,云计算将IT支出从资本支出(购买硬件)转变为运营支出(按需付费),这对于管理预算和根据实际需求调整成本具有吸引力。许多公司发现,对于不断变化的工作负载,云更经济实惠——无需为闲置服务器付费,并且可以在高峰使用后缩减环境规模。据埃森哲估计,在某些情况下,迁移到公共云可将总拥有成本降低高达 40%。此外,云提供商受益于规模经济,通常使商用计算和存储成本低于本地解决方案。需要注意的是,成本并不总是较低——如果云管理不善,成本可能会飙升——但总体而言,高效扩展的保障(需求增加时横向扩展,纵向扩展以避免浪费)是一个重要的驱动因素。云还减少了“以防万一”而维持过剩容量的需要——使 IT 团队无需不断升级硬件。实际上,许多制药公司正在将云计算相关的节省资金重新投资于新的数字化项目,从而形成良性循环,推动云计算的进一步应用。
4、协作和全球访问:制药研发和业务运营是全球性的,涉及研究站点、临床研究人员、制造站点和商业团队之间的跨境协作。云计算提供了一个可从任何地方访问的统一平台,从而大大增强了协作。来自不同国家的研究人员可以在共享的云工作区中协同工作,访问相同的数据和工具,而无需在同一个公司网络上。在监管提交期间,全球团队可以同时处理基于云的系统中的文件。随着行业越来越重视外部合作(与生物技术初创公司、学术实验室、合同研究组织等),云已成为一个集成层,允许与外部合作伙伴安全地共享数据,而无需开放内部防火墙。
5、创新与新技术(人工智能/机器学习、物联网、GenAI):云环境是快速创新的沃土,因为它们提供了快速获取新技术的途径。主要的云提供商不断推出尖端服务(例如,托管机器学习平台、物联网框架、区块链即服务,以及最近的生成式人工智能服务)。制药公司正在采用云技术,以便能够利用这些创新,而无需从头开始构建。例如,如果一家公司想要尝试生成式人工智能(探索 GenAI 概念验证)进行分子设计或医学写作,他们可以利用云提供商的 GPU 集群和大型语言模型 API,而不必采购昂贵的硬件并自行构建模型。事实上,调查显示,利用人工智能的能力如今已成为企业增加云投资的主要原因之一。在制药行业,这意味着利用人工智能进行药物研发(如前所述),或使用高级分析进行个性化营销——所有这些都由云托管的人工智能服务实现。简而言之,云是通往快速创新的大门——制药公司将其视为一个平台,使其能够更快地部署下一代解决方案(人工智能、数据科学、数字健康应用程序),并跟上技术变革的步伐。
6、可靠性、灾难恢复和安全态势提升:尽管安全曾被视为云计算的障碍,但如今许多公司意识到,领先的云提供商在安全性和可靠性方面投入巨资,通常比单家公司单打独斗的投入还要多。(1)制药业务(无论是研发系统还是生产基地的IT系统)的宕机成本可能非常高昂。云基础设施分布在多个数据中心,并具备冗余功能,与单个本地数据中心相比,可以提供更长的正常运行时间和更快的灾难恢复速度。(2)从安全角度来看,顶级云提供商拥有大批安全专家、先进的威胁检测和合规性认证(HIPAA、GxP 等),可以帮助制药公司满足监管安全要求。许多公司发现,相比更新旧的本地系统,迁移到云端可以更有效地实现安全现代化(零信任架构、更完善的身份管理、静态和传输加密)。由于看到证据表明云可以减少停机时间和安全事故,高管们越来越信任将关键任务系统迁移到云端。
7、监管灵活性和可扩展性:制药行业监管严格,这导致企业过去不愿频繁更改IT系统。
AI制药所需算力,提供商成熟:根据Clinked.com等网站发布,2025 年全球6大云提供商为亚马逊网络服务(AWS)、微软Azure、谷歌云、IBM云、甲骨文和阿里云。
亚马逊目前是全球领先者,占据着全球约30%的市场份额,并且在可预见的未来仍将保持领先地位,因为目前还没有人能够超越它。与许多在各自行业中处于世界领先地位的公司一样,亚马逊公司是第一个利用其亚马逊网络服务(AWS)产品抓住云计算机遇的公司。这使得它成为大型和小型公司从数据中心迁移到云计算时的首选。
AI制药所需算力,还有更高效空间可以提升:2025年8月22日英伟达官网发布,公司推出 NVIDIA Spectrum-XGS 以太网,这是一项跨规模技术,用于将分布式数据中心组合成统一的千兆级 AI 超级工厂。
随着人工智能需求的激增,单个数据中心的功率和容量已达到极限。为了实现扩展,数据中心必须扩展到任何一栋建筑之外,而这受限于现成的以太网网络基础设施,这些基础设施具有高延迟、抖动和不可预测的性能。
Spectrum-XGS 以太网是NVIDIA Spectrum-X 以太网平台的突破性产品,通过引入跨平台扩展的基础架构,打破了这些界限。它是 AI 计算超越纵向扩展和横向扩展的第三大支柱,旨在扩展 Spectrum-X 以太网的极致性能和规模,以连接多个分布式数据中心,形成具有千兆级智能能力的海量 AI 超级工厂。
Spectrum-XGS 以太网完全集成到 Spectrum-X 平台中,其特点是采用可动态调整网络以适应数据中心设施之间距离的算法。Spectrum-XGS 以太网具备先进的自动调整距离拥塞控制、精确延迟管理和端到端遥测功能,几乎使NVIDIA 集体通信库 (Collective Communications Library)的性能提升了一倍,从而加速了多 GPU 和多节点通信,从而在地理分布的 AI 集群中提供可预测的性能。因此,多个数据中心可以作为单个 AI 超级工厂运行,并针对长距离连接进行了全面优化。
采用新基础设施的超大规模领先企业,包括 CoreWeave,它将率先将其数据中心与 Spectrum-XGS 以太网连接起来。CoreWeave 联合创始人兼首席技术官 Peter Salanki 表示:“CoreWeave 的使命是为世界各地的创新者提供最强大的 AI 基础架构。借助 NVIDIA Spectrum-XGS,我们可以将数据中心连接到一台统一的超级计算机,让我们的客户能够访问千兆级 AI,从而加速各行各业的突破。”
Spectrum-X 以太网网络平台为多租户、超大规模 AI 工厂(包括全球最大的 AI 超级计算机)提供比现成以太网更高的带宽密度。它由 NVIDIA Spectrum-X 交换机和NVIDIA ConnectX -8 超级网卡组成,为构建 AI 未来的企业提供无缝的可扩展性、超低延迟和突破性的性能。
此次公告是在 NVIDIA 宣布一系列网络创新之后发布的,其中包括NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光子网络交换机,这些交换机使 AI 工厂能够跨站点连接数百万个 GPU,同时降低能耗和运营成本。
2.2 数据:从DL(深度学习)到FL(联邦学习),MNC(跨国巨头)强强联合,数据茧房被冲破
问题:数据不足与数据茧房。数据,是AI制药研发的基础资源,而AI在科学研究中面临的一个主要挑战是确保获得充足的高质量数据,以开发有效的模型。尽管公共数据丰富,但最有价值的知识往往仍隐藏在企业机密的数据孤岛中。尽管各行各业越来越愿意分享非竞争性见解,但这种合作往往受到底层数据机密性的制约。
根据Nature杂志2025年3月的报道,Alphafold 正面临药物数据短缺的问题。这是一款用于预测蛋白质结构的革命性诺贝尔奖获奖工具,但它存在一个问题:数据不足。
最新版本的 AlphaFold 3 被誉为药物发现的游戏规则改变者,因为它可以模拟蛋白质与其他分子(包括药物)的相互作用。但科学家表示, AlphaFold 的基础数据(数十万种公开的蛋白质结构)中缺乏这些相互作用的例子,这阻碍了该工具在此类应用的推进。
AlphaFold能够根据蛋白质序列预测其 3D 形状,这依赖于 PDB(蛋白质数据库) 中海量的蛋白质结构图谱的获取,这些结构图谱是通过 X 射线晶体学等实验方法绘制的。
解决1:FL(联邦学习)算法创新,既保护数据隐私安全,又共享更多高质量数据;国际药企巨头强强联合,提效AI药物研发。
AI解决科学问题方面的主要力量在于它能够通过从实验观察中挖掘因果模式来从数据中提取知识。这种形式的数字知识用于构建强大的预测模型,并已成为现代科学工具包的核心组成部分。例如,通过分析大量医学肺部图像,AI算法就能确定了照片特征与患者被诊断出患有癌症的概率之间的因果关系。
由于企业或个人的保密要求,数据的私有性已成为利用新人工智能工具的主要瓶颈,并限制了其效益。解锁嵌入在私有数据中的知识将显著增强人工智能的影响力,并为新一代具有更高性能和更广泛适用领域的预测模型开辟道路。这一观点引发了FL(联邦学习)领域的深入研究。
2016年,谷歌推出了 FL,此后在人工智能领域引起了广泛关注。这项研究工作旨在建立更好的模型,并由多个方面驱动,包括在一组设备之间分散学习过程的好处(跨设备 FL) 、访问广泛分布的知识(跨孤岛 FL)以及保护本地数据的隐私。目前,采用最多的 FL 方法是模型驱动。
它基于一个在非本地站点进行训练的中央模型。通过本地模型训练在每个站点提取知识,并通过安全网络通信将参数更新联合到中央模型中。中央模型成为联合知识的接收者,参数更新将知识从本地站点传递到中央模型(见下图)。由于只共享模型参数,因此该方法提供了良好的隐私保护。
MD-FL(模型驱动FL),中心模型使用本地私有数据以非本地化的方式进行训练;知识通过本地权重更新来传达。权重更新在中心模型中聚合。
DD-FL (数据驱动FL),依赖于中心公共数据集;知识通过本地私有模型预测的标签来传达。每个公共实例的标签集合都整合到中心数据集中。
解决2:产业链内跨领域合作,Apheris等整合跨界协作以突破AI驱动的药物发现的局限。
根据PWC普华永道2024年关于数据驱动未来研发的报告,如果没有协作,AI和数据驱动的转型几乎不可能成功。
以个性化精准医疗为例:一个健康人的基因组和其他生物学特征(例如蛋白质组和代谢组)会被数字化测序和存储。然后,她的医生可以访问这些数据,将其作为预防保健或疾病诊断的一部分。
如果确定了风险因素,就会为该人量身定制一种活性成分。但关键问题是:活性成分的生产商,即制药公司,如何获取个人特征和风险因素,从而开发新的活性成分?
在一个全面的“健康化身”中集中记录和存储这些特征似乎很有意义,因为它可以简化上述许多流程。然而,也存在一些挑战,包括隐私问题。个人医疗数据是一项非常值得保护的资产。其他障碍包括极高的数据存储量和成本(见下图)。
例如,750 MB 可能足以存储单个基因组,但存储单个人的 X-Omics 数据已占用数 TB 级空间。如果加上现实世界数据的存储,则达到 PB 级,而按世界人口计算,则达到 EB 级。因此,此类数据存储需要投入巨大的精力和成本。此外,制药公司现在有时与大型科技公司竞争,后者正在与医院和卫生组织建立合作伙伴关系。
然而,尽管面临这些重大挑战,系统地收集和分析个人医疗数据以开发新的活性物质和治疗方法的必要性是毋庸置疑的。公司可以迈出第一步,开放和共享部分自身数据。他们还可以与数据聚合器和服务提供商合作;通过研究和联合研究中心与医院合作;与诊断公司合作;以及与自行收集健康和患者数据的科技公司合作。此外,跨公司健康数据交换联盟正在建立。分子测序数据由商业和非商业工具提供。
诸如Apheris 等全球领先的的联合生命科学数据网络提供商,正在着手解决这个问题。随着FL(联邦学习)相关探索的上升,制药产业链内的跨领域合作正在推进。
解决3:政府主导数据整合,英国政府推出OpenBind开放数据集;我们预判,这只是各国政府推动AI制药进步的一个开始。
根据英国政府官网2025年6月9日的新闻发布,英国“OpenBind”联盟当日宣布,将利用突破性实验技术,生成全球最大的药物与蛋白质(人体的组成部分)相互作用数据集合。
新的 OpenBind 联盟将使英国成为人工智能驱动的药物发现领域的领导者——将药物发现和开发的成本削减高达 1000 亿英镑。
OpenBind 将创建史上最大的、经过实验验证的药物-蛋白质相互作用开放数据集。这将弥补医药研发领域长期存在的一个空白:缺乏将小分子与其结合的蛋白质关联起来的高质量、大规模数据集。这些数据集对于训练用于早期药物设计的 高质量AI模型至关重要。
OpenBind 将部署自动化化学和高通量 X 射线晶体学技术,最终在 5 年内生成超过 50 万个蛋白质-配体复合物结构和亲和力测量数据。这将使过去半个世纪以来所有公共数据的数量增加 20 倍,填补数据生态系统中阻碍现代生成模型开发和评估的关键空白。
OpenBind 提供了一个基础数据集,将支撑多个技术领域的进步,包括结构预测、生成式分子设计、分子对接和主动学习工作流程。它旨在与其他新兴方法协同工作,以帮助减少反复试验,为候选化合物的选择提供参考,并支持更系统地探索化学空间。
2.3 模型:生成式AI药企,从假设到实现,构建随时间增长的领先模型壁垒
综上所述,AI制药三要素中的数据与算力,目前并不构成相关药企的太大掣肘;那么,模型开发迭代进化的效率与训练经验积累的先机,就将成为目前领先企业的护城河。根据Biopharma于2024年11月发布的2025年展望分析,目前,全球领先的25家AI药企如下图。
下图显示了 AI 目前在药物研发流程中发挥重要作用,并有望颠覆传统实验技术的领域。AI 驱动型研发的巅峰是从头设计,整个临床前流程可在计算机模拟中进行,从而节省数十亿美元的研发成本,通过优化更安全、更易开发的分子,对精心挑选的靶点表现出强大的功效,从而降低药物成本并提高临床成功率。
根据美国NIH数据库2025年2月报告显示,虽然从头设计尚未得到证实,但截至 2023 年 12 月,已完成 I 期试验的 21 种 AI 开发药物的成功率为 80% 至 90%,显著高于传统方法的 40% 左右。我们持续看到使用 AI 开发的候选药物进入临床阶段的数量呈指数级增长,从 2016 年的 3 种增加到 2020 年的 17 种,再到 2023 年的 67 种。
跨生命科学模式(例如成像、多组学和超大型蛋白质组)的高质量数据访问,与大型深度学习模型在扩展和架构方面的最新进展之间的交汇,推动了医疗保健领域人工智能应用的爆炸式增长。而该领域的龙头企业中,有望随着模型数据不断交互进化的过程,而构建模型先机优势。
而模型优势的验证,也是投资者更关注的,就是全球首个AI研发的药物花落谁家。我们认为,会发生在目前自研或合作临床开发管线较多的英矽智能、Recursion、晶泰控股这类AI药企/CRO 或全球Top10的国际巨头之中。
下图是我们对已经上市的AI药企/CRO 龙头公司的近4年收入与研发加回的归母净利润的横向对比。
三、行业变局:科技巨头入局,产业链企业加速配置;十大制药巨头,AI布局,无一缺席
3.1 科技巨头:英伟达,推BioNeMo、广投AI药企;谷歌,并购DeepMind拆分Isophormic Labs
随着AI在医药领域应用的推进,科技巨头也正日益深入地融入到AI制药领域。AWS、英伟达、甲骨文等公司不再仅仅是基础设施提供商,它们正在积极塑造制药公司构建、购买和扩展人工智能解决方案的方式。
下图,为MarketandMarket分析报告所展示的AI制药生态系统中的参与者(左图)和市场空间(右图)。
英伟达,不但投资了十数家AI制药企业,还在通过扩展的 AI 模型库和灵活的部署选项,将生成式 AI 的力量赋能更多制药和生物科技公司,助力其药物研发。目前,已有 100 多家公司正在使用该公司的生物分子 BioNeMo 平台来加速疗法的开发。
英伟达BioNeMo 框架是用于计算药物发现的编程工具、库和模型的集合。它通过提供特定领域的优化模型和工具,加速构建和调整生物分子 AI 中最耗时且成本最高的阶段,这些模型和工具可以轻松集成到任何基于 GPU 的计算环境中。
2024年3月,BioNeMo在 NVIDIA GTC大会上宣布了最新功能,其中包括用于关键任务的全新基础模型,例如分析 DNA 序列、预测蛋白质结构以及基于RNA数据确定细胞功能。这些模型现已通过 NVIDIA NIM(NVIDIA 推理微服务)以易于部署的微服务形式提供。NVIDIA NIM是一组云原生微服务,旨在简化生成式AI模型在生产环境中的部署。NIM支持使用行业标准API将AI流程集成到应用程序中,同时简化AI模型开发的复杂性。
BioNeMo 框架代码库采用子项目结构设计,方便用户贡献代码并集中精力。整个代码库可以作为一个整体安装,也可以被拆分成可独立安装的组件,这些组件被称为子项目,并根据其特定的用途和范围进行组织。这种模块化架构增强了可扩展性,允许新的贡献以两种形式进行:创建新的子项目(广泛贡献)或扩展现有子项目(深度贡献)。
BioNeMo的核心是bionemo-core,它提供了基于 PyTorch 和 Lightning 框架构建的基本接口、通用数据处理和模型构建块。该核心依赖项支持框架内的所有其他子项目。例如,bionemo-llm子包基于NVIDIA的NeMo 和 Megatron 库构建,提供针对生物的定制功能和基础模型架构。bionemo-geometric 子包正在开发利用 PyTorch Geometric的图神经网络(GNN)支持,这凸显了BioNeMo 生态系统中创新的广度。
特定的模型和数据加载器被封装在其子包中,使用户能够选择性地仅添加与其特定用例相关的组件。这种模块化设计不仅简化了定制,还增强了可用性。
为了方便集成到私人项目中,BioNeMo子项目被设计托管在 Python包索引上(PyPI)。Docker 镜像支持快速开发,允许用户快速搭建完整的开发环境。仓库中的内置工具进一步帮助用户创建自己的 Python 项目并将其集成到工作流程中,从而简化开发流程。
BioNeMo框架目前支持通过NVIDIA NeMo Megatron构建基于BERT的大规模的模型。NVIDIA NeMo Megatron是一个可扩展的框架,用于开发自定义LLM、多模态和语音 AI。BioNeMo框架使用 NeMo Megatron构建生物分子BERT模型支持。
2025年7月16日,英伟达又联合加拿大魁北克人工智能研究所Mila,推出了一款全新AI+蛋白质基础生成模型La-Proteina ,能够生成全原子级别的蛋白质结构和序列。
互联网巨头谷歌,在AI制药领域最引人关注的,是他的英国子公司Deepmind旗下,于2021年拆分出来的AI制药公司Isomorphic Labs。该公司 AI新药临床在即。根据2025年7月7日英国健康科技世界官网报道,Isomorpic Labs的总裁兼Google DeepMind首席商务官科林·默多克 (Colin Murdoch) 表示,经过多年的开发,临床试验已经“非常接近”了。
2024 年,即发布 AlphaFold 3 的同一年,Isomorphic Labs与制药公司诺华和礼来签署了重要研究合作协议。它支持现有的药物项目,并在肿瘤学和免疫学等领域开发自己的内部候选药物,目的是最终在早期试验后获得许可。我们认为,其与药企巨头的合作,能在执行项目的过程中,不断反馈实验数据,反哺模型精度,形成数据整合壁垒,构成“数据-模型”飞轮效应。
2025 年 4 月,该公司在由风险投资公司 Thrive Capital 领投的首轮外部融资中筹集了 6 亿美元。公司表示,他们正在通过将机器学习研究人员与制药行业资深人士结合起来,打造一个“世界级的药物设计引擎”,以更快、更经济高效、更高成功率地设计新药。
3.2 产业链:泓博医药推DiOrion,深度智耀赋能IND合规提交,英矽智能猜想、分子、临床与发布全贯通
在中国,制药产业链上下游也在纷纷引入AI应用。
上游:CRO(研发外包服务)公司泓博医药于2025年1月在上海举行了DiOrion平台发布会。深度智耀,则在2025年4月美国FDA 新一代电子递交网关ESG NextGen将正式启用后,早在2024年5月,深度智耀DEEP-PV系统即率先实现FDA E2B R3区域标准兼容,并基于自研的AI医学翻译引擎,构建了从原始数据提取、术语智能匹配到双语报告生成的端到端解决方案。
中游:AI制药企业英矽智能,凭借自建的Pharma.AI平台实现了端到端全流程的AI应用,并有20多种临床候选化合物,其中10种已经获批IND(新药临床研究)。2023年6月,公司的TNIK候选药物完成了临床IIa期的首例患者给药。2025年7月,该候选药物的2期临床数据在Nature杂志发表,实现了AI制药行业首个临床概念验证案例。
下游:2025年2月6日,AI医疗公司智云健康宣布将DeepSeek-R1模型接入公司自研医疗人工智能系统"智云大脑"。这一举措将增强智云医疗大脑的数据挖掘能力,提高数字化慢病管理效率,进一步提升医疗AI新质生产力。
3.3 制药巨头:默沙东、辉瑞、礼来、BMS等Top 10跨国药企,数百亿美元布局AI制药相关公司
制药巨头理念转变中。2025年7月,风投公司Define Venture发布了制药巨头高管对AI观点的调研报告。该报告基于对 40 多位制药和技术领导者(包括前 20 家制药公司中的 16 家,以及亚马逊网络服务、英伟达和甲骨文等大型科技公司)的采访和调查显示,AI已从孤立的试点转变为一项战略要务,在成本上升、利润率收紧和法规不断变化的情况下,其紧迫性日益增强。
约85%的受访企业领导者表示,他们正在加大对人工智能的投资,其中70%的企业将其视为当务之急。在排名前20的公司中,这一数字跃升至85%。
报告指出,制药行业在自主研发而非购买方面的思维模式发生了重大转变。尽管该行业历来倾向于自主研发AI工具,但目前只有30%的公司打算继续沿用这种方式,另有40%的公司倾向于混合战略,还有30%的公司现在优先考虑外部优先的解决方案。
AI制药相关BD爆发。从上图insight数据库统计的相关交易量来看,近8年发生了近百起(94起)。从下图医药魔方统计的全球AIDD(AI药物研发)相关交易首付额和总额Top 20的项目来看,重大交易集中发生在近5年内,总额超过500亿美元。
四、投资策略
4.1 策略1:AI新药破局在即,首选管线丰富、兑现力强者
综上所述,从AI药企的角度,随着AI制药行业奇点来临,首个重要时点,必然是人类首个AI驱动研发的药物的获批上市;换言之,不论模型还是数据更优,首个验证的重磅药才将是焦点。因此,我们建议关注英矽智能、晶泰控股等已经有自研管线或合作项目进入临床阶段的赛道龙头。
4.2 策略2:制药与跨界企业入局者众,优选壁垒随时间增厚者
同时,因为AI制药本身是科技跨界的崭新赛道,未来的首个破局者,即可能是AI药企,也可能是传统仿创龙头在AI领域前瞻深耕者,还可能是非药领域的新进科技公司。因此,我们建议关注石药集团、复星医药等在AI领域长期前瞻布局的公司收获相关成果的高弹性可能。
五、风险提示
汇兑风险:部分公司海外业务占比高,人民币汇率的大幅波动可能会对公司利润产生明显影响。其程度依赖于汇率本身的波动,同时也取决于公司套期保值相关工具的使用和实施。
国内外政策风险:若海外贸易摩擦导致产品出口出现障碍或海外原材料采购价格提升,将可能对部分公司业绩增长产生影响。
投融资周期波动风险:医药行业投融资水平对部分公司有较大影响,若全球医药投融资市场不够活跃,将影响部分公司的业绩表现。
并购整合不及预期的风险:部分公司进行并购扩大业务布局,如并购整合不能顺利完成,可能影响公司整体业绩表现。
附录