醫院裡的AI:準確率高,但病人真的變健康了嗎?
全球醫院快速導入AI工具,從自動病歷到影像判讀,準確率數據亮眼。但研究者警告:我們根本不知道這些工具是否真正改善了病人的健康結果。
一個AI工具能在三秒內判讀胸部X光,準確率達到九成以上——聽起來令人振奮。但如果醫生看完AI的結論後,改變了原本的診斷直覺,而那個直覺其實才是對的呢?
導入速度遠超驗證速度
全球醫療體系正在快速擁抱AI。自動生成診察記錄的「AI書記員」、掃描電子病歷以標記高風險病患的預測工具、自動判讀影像的系統——這些技術已不是未來式,而是現在進行式。
根據2025年1月明尼蘇達大學發表的研究,美國約65%的醫院已導入AI預測工具。然而,其中只有三分之二的醫院評估過工具的準確性,檢驗演算法偏差的醫院比例更低。
密西根大學電腦科學家Jenna Wiens與多倫多大學的Anna Goldenberg,在《Nature Medicine》期刊發表論文,直指這個問題的核心:醫療AI的採用速度,已遠遠超過我們對它實際效果的理解。
「準確」不等於「有效」
這是整件事最關鍵、也最容易被忽略的一點。
AI工具的「準確率」,衡量的是它的輸出與標準答案的吻合程度。但醫療的目標從來不只是「答對」,而是讓病人更健康。這兩者之間,隔著醫生的判斷、病患的配合、醫院的流程,以及無數個無法量化的人際互動。
Wiens舉例:AI或許能更快解讀X光片,但醫生會對這個結果信任多少?這份信任會如何影響他與病患的溝通?最終,病患的治療結果會因此改善還是變差?「我們就是不知道,」她說。
AI書記員的案例同樣值得深思。醫生反映這類工具讓他們能專注於與病患的對話,初步研究也顯示它有助於減少醫師的職業倦怠。但Wiens提出一個更深層的疑問:教育研究已顯示,自動化工具可能影響人類的認知處理方式。長期依賴AI整理資訊的醫生,是否會在不知不覺中削弱自己獨立分析病患狀況的能力?
亞洲視角:機會與隱憂並存
對於華人世界而言,這場討論有幾個特別值得關注的面向。
台灣的健保資料庫是全球最完整的醫療數據庫之一,為AI訓練提供了珍貴資源,也讓台灣在醫療AI研究上具備一定優勢。然而,數據的豐富不代表工具的有效性已獲驗證——這正是Wiens等研究者的核心警告。
在中國大陸,醫療AI的發展由政策強力推動,阿里健康、騰訊醫療等企業積極布局,部分地區的基層醫療機構已大量依賴AI輔助診斷。這在醫療資源不均的廣大農村地區或許是必要之舉,但在缺乏嚴格成效驗證的情況下,規模化導入的風險同樣不容忽視。
香港與新加坡作為亞洲醫療樞紐,在監管框架與臨床研究能力上相對完善,或許能在這場「導入速度vs.驗證深度」的拉鋸中,扮演更審慎的示範角色。
Wiens的立場並非反對AI,而是呼籲更嚴謹的問責機制。「我相信AI改善臨床照護的潛力,」她說,「但不是全有或全無。答案在中間某個地方。」
相关文章
一台名為ElliQ的AI陪伴機器人,意外地幫助了一位帕金森氏症患者重拾生活節律。這個來自以色列的科技,對華人社會的長照挑戰意味著什麼?
NPR主持人馬努什·扎莫羅迪新書《Body Electric》深入探討科技對人體健康的影響。從脊椎到睡眠,數位時代的身體代價遠比我們想像的更深遠。
美國聯邦醫療保險首次為AI照護建立支付機制,10年實驗計畫ACCESS正式啟動。成果導向的支付模式,能否重塑全球醫療科技的商業邏輯?
美國新創Basata以AI自動化處理專科轉診,已處理50萬份轉介單。在醫療行政數位化的浪潮下,亞洲醫療體系能從中學到什麼?
观点
分享你对这篇文章的看法
登录加入讨论