醫院裡的AI：準確率高，但病人真的變健康了嗎？

全球醫院快速導入AI工具，從自動病歷到影像判讀，準確率數據亮眼。但研究者警告：我們根本不知道這些工具是否真正改善了病人的健康結果。

一個AI工具能在三秒內判讀胸部X光，準確率達到九成以上——聽起來令人振奮。但如果醫生看完AI的結論後，改變了原本的診斷直覺，而那個直覺其實才是對的呢？

導入速度遠超驗證速度

全球醫療體系正在快速擁抱AI。自動生成診察記錄的「AI書記員」、掃描電子病歷以標記高風險病患的預測工具、自動判讀影像的系統——這些技術已不是未來式，而是現在進行式。

根據2025年1月明尼蘇達大學發表的研究，美國約65%的醫院已導入AI預測工具。然而，其中只有三分之二的醫院評估過工具的準確性，檢驗演算法偏差的醫院比例更低。

密西根大學電腦科學家Jenna Wiens與多倫多大學的Anna Goldenberg，在《Nature Medicine》期刊發表論文，直指這個問題的核心：醫療AI的採用速度，已遠遠超過我們對它實際效果的理解。

這是整件事最關鍵、也最容易被忽略的一點。

廣告合作

AI工具的「準確率」，衡量的是它的輸出與標準答案的吻合程度。但醫療的目標從來不只是「答對」，而是讓病人更健康。這兩者之間，隔著醫生的判斷、病患的配合、醫院的流程，以及無數個無法量化的人際互動。

Wiens舉例：AI或許能更快解讀X光片，但醫生會對這個結果信任多少？這份信任會如何影響他與病患的溝通？最終，病患的治療結果會因此改善還是變差？「我們就是不知道，」她說。

AI書記員的案例同樣值得深思。醫生反映這類工具讓他們能專注於與病患的對話，初步研究也顯示它有助於減少醫師的職業倦怠。但Wiens提出一個更深層的疑問：教育研究已顯示，自動化工具可能影響人類的認知處理方式。長期依賴AI整理資訊的醫生，是否會在不知不覺中削弱自己獨立分析病患狀況的能力？

對於華人世界而言，這場討論有幾個特別值得關注的面向。

台灣的健保資料庫是全球最完整的醫療數據庫之一，為AI訓練提供了珍貴資源，也讓台灣在醫療AI研究上具備一定優勢。然而，數據的豐富不代表工具的有效性已獲驗證——這正是Wiens等研究者的核心警告。

在中國大陸，醫療AI的發展由政策強力推動，阿里健康、騰訊醫療等企業積極布局，部分地區的基層醫療機構已大量依賴AI輔助診斷。這在醫療資源不均的廣大農村地區或許是必要之舉，但在缺乏嚴格成效驗證的情況下，規模化導入的風險同樣不容忽視。

香港與新加坡作為亞洲醫療樞紐，在監管框架與臨床研究能力上相對完善，或許能在這場「導入速度vs.驗證深度」的拉鋸中，扮演更審慎的示範角色。

Wiens的立場並非反對AI，而是呼籲更嚴謹的問責機制。「我相信AI改善臨床照護的潛力，」她說，「但不是全有或全無。答案在中間某個地方。」