AI健康應用爆發，大模型「看病」是否靠譜？我們進行了實測

2026-01-23 20:24

歲末年初，AI健康賽道進入密集爆發期。

以去年12月中旬螞蟻集團升級發佈AI健康應用「螞蟻阿福」，並一度衝入蘋果應用商店排行榜前二為標誌，此后1個月時間里，百度升級發佈文心健康管家，OpenAI推出ChatGPT Health功能，京東健康發佈循證醫學AI產品「知醫」，百川智能也在沉寂許久后高調亮相，發佈新一代開源醫療增強大語言模型Baichuan-M3……大廠和獨角獸企業們紛紛向這一垂類領域吹響「衝鋒號」，掀起了一股AI醫療熱潮。

風口之下，使用大模型「看病」是否靠譜？新京報貝殼財經記者測試了7款AI健康應用解讀體檢報告的能力，發現這幾款應用的解讀均較為謹慎，主要不同點出現在是否需要就醫，以及后續追問上。不過，AI也並非「萬無一失」，有個別應用把評估甲狀腺功能的核心指標 TSH（促甲狀腺激素）解讀成了HCG（人絨毛膜促性腺激素），甚至建議用户排查「是否懷孕」。

面對行業熱潮，監管層陸續發聲。2025年12月30日，北京市的「AI+醫療健康」新政為行業劃出了明確的邊界。1月7日，國家網信辦《人工智能擬人化互動服務管理暫行辦法（徵求意見稿）》也為AI醫療的高速發展設定「交通規則」和「安全護欄」。

AI解讀體檢報告很謹慎，「幻覺」仍存在

爲了測試體檢報告解讀功能，貝殼財經記者將一份甲狀腺體檢報告分別發給了小荷AI醫生、夸克健康、平安好醫生、訊飛曉醫、百度文心健康、京東健康、螞蟻阿福7款市面上常見的健康大模型，這7款大模型均具備拍照識別解讀報告、拍藥盒、拍患處、AI問診等基本功能。

此次測評中，在症狀診斷上，幾個大模型都表現出「謹慎」的態度，使用了可能、提示、傾向於等詞。比如，百度文心健康提示，由於單個指標超出正常範圍，傾向於認為用户出現甲狀腺功能減退的改變。

不同AI健康應用對同一份體檢報告的解讀。貝殼財經記者張曉慧/整理

在這份體檢報告中，TSH（促甲狀腺激素）指標高於參考值，因此成為幾個大模型共同關注的指標。貝殼財經測評發現，7個大模型應用均分別分析了特殊指標和其余指標，其中，僅百度文心健康根據出現異常的指標分析了其他項正常指標可能存在問題，提示儘管另一項指標T3處於正常值範圍，但結合TSH升高，考慮用户T3指標可能偏低。

對於是否就醫問題，幾個大模型答案存在明顯分歧。夸克健康、訊飛曉醫、螞蟻阿福明確建議用户前往醫院就診，其余應用則建議定期複查或出現相關症狀及時就醫。

除了以上具有共性的分析外，小荷AI醫生、百度文心健康在問答結束后追問用户是否存在相關症狀，京東健康則給出相關的醫生問答，這可以看作是應用提高用户留存度的動作。在7個大模型應用中，小荷AI醫生的語言風格明顯更為口語化，出現諸如「咱們」「勉強達標」「督促」等表達。

不過，大模型也並非「萬無一失」。此前，有用户向記者反饋稱，個別應用將TSH（促甲狀腺激素）指標解讀成了判定是否懷孕的HCG（人絨毛膜促性腺激素）指標，對此大模型回覆稱「此前的回覆中提到的HCG（人絨毛膜促性腺激素）的檢測項目是將TSH（促甲狀腺激素）混淆所致，對此深表歉意。」

在本次實測中，記者也發現了相同的「幻覺」：有應用搞混了TSH和HCG的區別，且這一錯誤出現了兩次。具體表現為，首次生成中，應用將TSH的中文名稱誤標爲了「人絨毛膜促性腺激素」，不過后續解讀是正確的。而記者對此進行二次複覈時，應用直接把TSH識別成了HCG，並建議「優先排查是否懷孕」。

對此，有醫療垂類模型的技術人員告訴貝殼財經記者，幻覺是大模型的通病，垂類模型也難以百分百消除幻覺，只能儘量減少。

當醫生處方和AI建議衝突，有醫院提醒患者切勿過分依賴AI問診

事實上，當前監管層也注意到了AI醫療熱潮，並給出了提醒。

北京市衞健委發佈的《北京市支持醫療健康領域人工智能應用發展行動計劃（2026—2027年）》及《北京市醫療健康領域支持人工智能產業創新發展若干措施（2026—2027年）》強調，醫療行業AI生態體系需要醫企協同，要秉持包容審慎原則，遵循倫理規範，保障患者的信息安全和生命健康安全，禁止用AI完全替代醫務人員的專業判斷。

目前，醫生處方和AI建議衝突已經引發關注。據媒體報道，有受訪者帶孩子到醫院治療感冒，醫生開具了一款「人干擾素」的霧化藥處方，由於對藥物不熟悉，該受訪者詢問了一款熱門健康AI應用后，AI建議謹慎使用該藥物，稱「目前該藥物針對兒童羣體的臨牀數據相對有限，安全性尚未完全明確。」

貝殼財經記者注意到，已有公立醫院的官方賬號提醒患者切勿因為過分依賴AI問診，錯過到醫院就診的黃金窗口期。汕頭大學醫學院第一附屬醫院發佈的一則案例顯示，一對新手父母在孩子出現反覆咳嗽、發熱等症狀時向AI問診平臺自行諮詢，被判斷為普通呼吸道感染，並建議居家用藥，結果導致孩子病情反反覆覆近一個月，到醫院就診時已經發展為肺炎，且經由醫生診斷后並非普通感冒，而是與之症狀相似的腺病毒感染。

事實上，早在健康大模型風靡以前，「用AI看病」已經開始流行。ChatGPT介紹推出「ChatGPT健康」的初衷時介紹，每周有數以億計的人向ChatGPT提出健康與身心福祉相關的問題。

住院醫師孫亞軒最早關注到這個現象是Deepseek出現以后，「當時我們主任很震驚，沒想到用Deepseek搜醫學相關的知識那麼全，開會的時候專門告訴我們對待患者的問題一定要更謹慎一些。」

在孫亞軒看來，患者有一些健康問題向AI諮詢是「有用」的，但是「肯定不能算是看病，只能當作瞭解病情，輔助決策的工具。」

有健康應用的用户告訴貝殼財經記者，AI的作用更類似於「助手」，可作為醫生的補充。

「有一些小的問題，豆包會安撫我不用擔心，如果阿福也認為是小問題，我就可以更放心。」評價自己經常「疑病恐病」的小吳時不時就會向AI大模型提問健康問題，頻繁使用下來，他總結出一套平衡使用不同大模型的方法論。

對於小吳來説，這些健康大模型應用的意義不是代替醫生和醫院，更像是一個隨時隨地都在、有醫學知識的小助手。有些微小的症狀「去了醫院反而會被醫生覺得無語」，小吳就會直接詢問健康大模型。在他看來，這類App緩解了焦慮，但自己並不會完全採取AI給的建議。

像小吳一樣的用户不在少數，多位受訪者表示，日常生活中一些健康問題會向健康大模型求助。不過，受訪者評價褒貶不一，有的認為「給的建議很合理」，也有受訪者直言要「避大雷」。

記者注意到，目前螞蟻阿福、百度健康、平安好醫生已推出醫生線上問診功能，用户支付問診費用后，即可線上請對應的醫生看診，圖文、語音、視頻三種問診形式費用不一。其中，平安好醫生、百度健康僅列出可線上接診的醫生名單供用户選擇；螞蟻阿福的「AI找醫生」則接入了互聯網醫療平臺「好大夫在線」，通過大模型識別並分析用户需求，提供針對性推薦。

從使用工具到陪伴的朋友，AI也可引流

事實上，互聯網健康並不是一個新鮮的概念，京東健康、平安好醫生、百度健康等早已是互聯網醫療領域的老玩家，在AI時代接入大模型更像是一個自然而然的動作。

目前，螞蟻阿福、小荷AI醫生、訊飛曉醫三個健康大模型應用均推出了獨立的App，夸克、百度將AI健康模塊嵌入到搜索引擎App中，平安好醫生、京東健康則在原來的App中增加AI問答等AI功能。從這一角度來看，螞蟻阿福、小荷AI醫生、訊飛曉醫三個應用表現出更明顯的垂直性特徵。

隨着「大廠」紛紛下場，C端健康大模型應用的競爭變得更加激烈。其中，聲勢最大的，反而是「最年輕」的螞蟻阿福。這款App前身是螞蟻集團在2025年6月推出的AI健康應用AQ，半年后，AQ改名阿福，定位從「AI工具」轉向「AI健康朋友」。

從使用工具到陪伴的朋友，表面看是品牌戰略升級，但「陪伴」也就意味着更高的使用頻率和用户留存。而這些則潛在地影響着健康大模型的「變現」能力。

貝殼財經記者測評上述健康大模型應用發現，垂直類健康大模型已經在一定程度上成為「引流」入口，功能上也不再侷限於單一屬性。

螞蟻集團旗下的螞蟻阿福與字節跳動旗下的小荷AI醫生再次表現出共性，在兩個應用中使用「拍藥品」功能時，均會出現跳轉其他平臺便捷買藥的提示，前者可跳轉至淘寶閃購，后者則可以在抖音平臺購藥。此外，在螞蟻阿福尋醫問藥時還可授權使用支付寶查詢醫保。

不過，這些應用對商業化變現也較為謹慎。螞蟻阿福就公開發聲稱，其健康問答內容沒有任何廣告推薦、不存在商業排名，也不受任何其他商業因素干擾。

智源研究院發佈的《2026十大AI技術趨勢》認為，當前C端AI應用的競爭目標已逐漸清晰，核心在於對「Super App（超級應用）」的攻略，其典型特徵呈現為「All in One」的功能設計，即不再是侷限於單一工具屬性，而是基於高性能基礎模型直接產品化，通過一個入口實現從信息獲取、任務規劃到問題解決的閉環。

從這一角度看，作為互聯網「大廠」旗下產品，AI健康應用背后有着豐富的平臺生態，部分已經表現出各應用間互相打通的趨勢。智源行業研究中心負責人倪賢豪在接受貝殼財經記者採訪時介紹，垂直賽道大模型一定有機會成為一個超級應用，但是實現與否還要看垂直大模型定位用户的留存程度。

新京報貝殼財經記者張曉慧羅亦丹實習生徐千懿

校對趙琳楊利

AI健康應用爆發，大模型「看病」是否靠譜？我們進行了實測

推薦文章

美股機會日報 | 凌晨3點！美聯儲將公佈1月貨幣政策會議紀要，納指期貨漲近0.5%；13F大曝光！巴菲特連續三季減持蘋果

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意

財報前瞻 | 英偉達Q4財報放榜在即！高盛、瑞銀預計將大超預期，兩大關鍵催化將帶來意外驚喜？