醫院裡的AI:準確率高,但病人真的變健康了嗎?
全球醫院快速導入AI工具,從自動病歷到影像判讀,準確率數據亮眼。但研究者警告:我們根本不知道這些工具是否真正改善了病人的健康結果。
一個AI工具能在三秒內判讀胸部X光,準確率達到九成以上——聽起來令人振奮。但如果醫生看完AI的結論後,改變了原本的診斷直覺,而那個直覺其實才是對的呢?
導入速度遠超驗證速度
全球醫療體系正在快速擁抱AI。自動生成診察記錄的「AI書記員」、掃描電子病歷以標記高風險病患的預測工具、自動判讀影像的系統——這些技術已不是未來式,而是現在進行式。
根據2025年1月明尼蘇達大學發表的研究,美國約65%的醫院已導入AI預測工具。然而,其中只有三分之二的醫院評估過工具的準確性,檢驗演算法偏差的醫院比例更低。
密西根大學電腦科學家Jenna Wiens與多倫多大學的Anna Goldenberg,在《Nature Medicine》期刊發表論文,直指這個問題的核心:醫療AI的採用速度,已遠遠超過我們對它實際效果的理解。
「準確」不等於「有效」
這是整件事最關鍵、也最容易被忽略的一點。
AI工具的「準確率」,衡量的是它的輸出與標準答案的吻合程度。但醫療的目標從來不只是「答對」,而是讓病人更健康。這兩者之間,隔著醫生的判斷、病患的配合、醫院的流程,以及無數個無法量化的人際互動。
Wiens舉例:AI或許能更快解讀X光片,但醫生會對這個結果信任多少?這份信任會如何影響他與病患的溝通?最終,病患的治療結果會因此改善還是變差?「我們就是不知道,」她說。
AI書記員的案例同樣值得深思。醫生反映這類工具讓他們能專注於與病患的對話,初步研究也顯示它有助於減少醫師的職業倦怠。但Wiens提出一個更深層的疑問:教育研究已顯示,自動化工具可能影響人類的認知處理方式。長期依賴AI整理資訊的醫生,是否會在不知不覺中削弱自己獨立分析病患狀況的能力?
亞洲視角:機會與隱憂並存
對於華人世界而言,這場討論有幾個特別值得關注的面向。
台灣的健保資料庫是全球最完整的醫療數據庫之一,為AI訓練提供了珍貴資源,也讓台灣在醫療AI研究上具備一定優勢。然而,數據的豐富不代表工具的有效性已獲驗證——這正是Wiens等研究者的核心警告。
在中國大陸,醫療AI的發展由政策強力推動,阿里健康、騰訊醫療等企業積極布局,部分地區的基層醫療機構已大量依賴AI輔助診斷。這在醫療資源不均的廣大農村地區或許是必要之舉,但在缺乏嚴格成效驗證的情況下,規模化導入的風險同樣不容忽視。
香港與新加坡作為亞洲醫療樞紐,在監管框架與臨床研究能力上相對完善,或許能在這場「導入速度vs.驗證深度」的拉鋸中,扮演更審慎的示範角色。
Wiens的立場並非反對AI,而是呼籲更嚴謹的問責機制。「我相信AI改善臨床照護的潛力,」她說,「但不是全有或全無。答案在中間某個地方。」
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
YouTube正式推出將Shorts觀看時間設為零分鐘的功能,等同從App中移除短影音。這對數位健康、親子管理與平台商業模式意味著什麼?
美國醫療機構紛紛推出自有AI醫療聊天機器人,試圖引導已在使用AI問診的患者。這股趨勢對亞洲醫療體系與華人社會意味著什麼?
伊隆·馬斯克承諾Neuralink將帶來超人能力,但現實是什麼?從動物實驗爭議到人體試驗,腦機接口技術的真實進展與華人世界的意義深度解析。
當全球掀起數位排毒風潮,有一群人選擇反其道而行。他們每天使用螢幕近19小時,卻不認為這是問題。螢幕時間的爭論,究竟在爭什麼?
观点
分享你对这篇文章的看法
登录加入讨论