熱門資訊> 正文
2025-06-26 08:17
2025年6月24日,國際頂級醫學期刊《自然·醫學》(Nature Medicine)刊發的一篇論文,在中國乃至全球的醫療AI領域投下了一枚重磅炸彈。
由浙江省腫瘤醫院與阿里巴巴達摩院聯合團隊研發的胃癌篩查AI模型GRAPE,宣告僅通過最常規的腹部平掃CT影像,實現對胃癌,特別是早期胃癌的規模化篩查。
在胃癌發病率、死亡率雙高,而早期診斷率嚴重不足的中國,這一成果直指一個規模巨大、卻始終未能有效解決的公共衞生痛點。
繼胰腺癌篩查模型PANDA之后,達摩院的「平掃CT+AI」多癌篩查戰略再下一城,其背后的商業邏輯、市場格局與未來想象空間,值得進行一次徹底的審視與剖析。
胃癌,是中國的一場「沉默的流行病」。根據國家癌症中心的數據,中國每年新增胃癌患者約35.87萬,死亡人數高達26.04萬,佔全球總數的近40%。與此相伴的,是「兩高一低」的嚴峻現實:發病率高、死亡率高,以及僅為35.9%的五年生存率。
這道生存率鴻溝,在與鄰國日本(60.3%)和韓國(68.9%)的對比中顯得尤為刺眼。值得注意的是,這一差距並非源於手術技術或創新葯物的代差,其根本原因在於后者自上世紀80、90年代起便推行了全國性的胃鏡篩查計劃。這些計劃將韓國等國的胃癌早診率(確診時仍屬早期的比例)提升至60-70%的水平;而在中國,超過70%的患者在確診時已是進展期,錯失了最佳治療窗口。
醫學界的共識和數據早已證明,早期發現是逆轉胃癌高死亡率的唯一關鍵。早期胃癌(EGC)經過治療后的五年生存率高達95-99%,幾乎等同於治癒;而晚期患者則不足30%。
因此,GRAPE模型所要解決的,並非一個未知的科學難題,而是一個已被充分驗證、但始終無法在中國大規模有效實施的巨大市場缺口。
既然胃鏡是金標準,為何在中國難以普及?答案在於其固有的三大瓶頸:侵入性、資源依賴和低效率。
首先,胃鏡作為一種侵入性檢查,會給患者帶來不適與痛苦,導致民眾接受度與依從性極低。官方數據顯示,中國每年完成的消化道內鏡檢查不足4000萬例,大量人羣終身未接受過胃鏡檢查 。在一些針對性的篩查項目中,依從率甚至低至18-48%。
其次,胃鏡檢查高度依賴操作醫師的經驗和麻醉科醫生的配合,優質醫療資源分佈不均,難以支撐全國範圍的普篩。
最后,也是最致命的一點,是其效率低下。傳統胃鏡篩查的胃癌檢出率僅為1.16%至1.20%,這意味着平均需要進行約100次胃鏡檢查才能發現1例胃癌。這種「大海撈針」式的模式,對於擁有14億人口的中國而言,無論在經濟成本還是醫療資源上,都是難以承受的。
因此,《中國早期胃癌篩查流程專家共識(2022版)》等權威指南明確指出,當前最可行的策略是:先通過非侵入性方法篩選出高風險人羣,再對這部分人羣進行靶向性胃鏡精查。這一策略的核心,在於找到一個精準的「過濾器」。
然而,現有的「過濾器」們表現均不盡如人意。以血清學檢測(如胃蛋白酶原PG、胃泌素G-17、幽門螺桿菌Hp抗體等)為代表的傳統方法,被證明對檢出率的提升極為有限,僅能將檢出率從1.20%微升至1.25%。而近年來備受關注的液體活檢技術,儘管前景廣闊,但目前仍面臨成本高昂、靈敏度有待提升等商業化初期的難題。
這就形成了一個清晰的市場真空:市場迫切需要一種全新的、非侵入性的、低成本且高精度的風險分層工具。GRAPE的價值定位,並非要取代胃鏡,而是要成為那個高效的「過濾器」,確保每一臺寶貴的胃鏡檢查都能用在「刀刃」上,從而在宏觀層面解決整個篩查體系的效率難題。
GRAPE模型的誕生,本身就是對行業固有認知的一次顛覆。長期以來,醫學界普遍認為平掃CT(NCCT)因其對胃、腸等空腔臟器的成像對比度低,且易受氣體、蠕動等因素干擾,無法用於胃癌篩查。
達摩院與浙江省腫瘤醫院的聯合團隊,通過構建全球最大規模的胃癌平掃CT影像數據集,並利用深度學習技術,從這些在人眼看來信息量極低的影像中,挖掘出了早期病變的微妙特徵。
這一成果建立在達摩院「平掃CT+AI」技術路線的長期積累之上。其早前發佈的胰腺癌篩查模型PANDA,同樣基於平掃CT,也登上了《自然·醫學》,並獲得了FDA的「突破性醫療器械」認定,這為GRAPE的技術可靠性提供了強有力的背書。
GRAPE模型採用了一個高效且巧妙的兩階段深度學習框架,其核心基於在醫學影像分割領域被廣泛驗證的nnU-Net架構。
模型首先利用一個分割網絡,在整個三維CT掃描中精準定位並「框」出胃部區域。
隨后,一個包含分類和分割雙重任務的網絡,對分離出的胃部區域進行精細分析。它不僅能輸出一個將患者分為胃癌(GC)或非胃癌(NGC)的風險評分,還能同時生成一個像素級的分割掩碼,在圖像上直接標示出可疑的腫瘤區域。
這種架構設計是其未來臨牀推廣的關鍵優勢之一。它並非一個提供「是」或「否」答案的「黑箱」,其輸出的分割圖像(即可解釋性)為放射科醫生提供了直觀的視覺證據。醫生可以據此驗證AI的判斷,這極大地增強了臨牀採納的信任度,有效解決了許多醫療AI工具因「不可解釋」而難以被醫生接受的核心痛點。
GRAPE的性能表現經過了極為嚴苛的多中心、大規模數據驗證。模型在包含20箇中心、近10萬人的數據上進行了開發與驗證。
曲線下面積(AUC)高達0.970,敏感性為85.1%,特異性為96.8%。
表現依然穩健,AUC為0.927,敏感性81.7%,特異性90.5%。
在與13名放射科醫生的「人機大戰」中,GRAPE(AUC 0.92)的表現全面超越了所有人類專家(AUC範圍0.76-0.85),平均靈敏度提升21.8%,特異性提升14.0%。
然而,對於一個篩查工具而言,最有價值的指標並非其平均性能,而是其對早期癌症的檢出能力。論文數據顯示,GRAPE對早期胃癌(EGC, T1/T2期)的檢出敏感性約為50%,而對進展期(T3/T4期)則超過90% 。
篩查的全部意義就在於「早」,能將晚期胃癌的發現窗口提前至早期,這正是GRAPE的顛覆性價值。
達摩院的雄心不止於胃癌。其公開宣稱的「一掃多查」戰略,是以一次平掃CT檢查為入口,通過AI平臺同時對胰腺癌(PANDA)、胃癌(GRAPE)、肝癌、結直腸癌、食管癌乃至骨質疏松等多種疾病進行篩查。此前,達摩院已實現在胰腺癌上的突破。
當前,醫療AI市場高度碎片化,充斥着大量只能解決單一問題的「點解決方案」。對於醫院而言,採購、集成、管理數十個來自不同供應商的AI工具,是一場IT和工作流程的噩夢。
如果達摩院的「一掃多查」,能夠在多種腫瘤或其他疾病中顯示積極作用,對醫院來説,它就只需一次性集成該平臺,即可獲得一個不斷擴充的、覆蓋多個病種的AI能力庫。
商業化的核心是支付。對於GRAPE這類「軟件即醫療器械」(SaMD),其報銷路徑在中國尚不清晰。
因此,對於類似GRAPE的軟件即醫療器械類產品商業化可能需要多條腿走路:
這是目前最清晰、最可行的主渠道。向美年健康這樣的大型連鎖體檢機構銷售「一掃多查」AI服務包,由體檢機構作為增值服務向其企業和個人客户推廣。
醫院在進行常規CT檢查時,向患者提供一個可選的、自費的「AI癌症風險評估」附加項。考慮到中國平掃CT的價格相對低廉(約300-500元),增加一項數百元的AI分析費用,對於關注健康的中產階層具有吸引力。
將GRAPE算法授權給影像設備巨頭,作為其高端CT機型的一大賣點。這是一種輕資產、高槓杆的渠道擴張模式。
從衞生經濟學的角度,向支付方(包括商業保險和未來的醫保政策制定者)證明,投入AI篩查的成本,遠低於其所能節省的晚期癌症治療費用。這需要長期的、大規模的前瞻性隊列研究數據支撐,是終極目標,但道阻且長。
不過積極來看,GRAPE有望在未來大幅改善中國胃癌的檢出率,提高中國患者生存率,讓我們一起期待其大規模的前瞻性驗證。
本文來自微信公眾號「硬AI」,作者:硬ai,36氪經授權發佈。