AIは「名医」を超えるのか——診断の未来
米国トップ診断医とAIが同じ症例に挑んだ。AIが医療診断に与える影響、日本の高齢化社会における意味、医師の役割の変容を多角的に考察します。
歯ブラシを飲み込んだ患者が、なぜ敗血症で倒れたのか——その答えを、人間の医師とAIが同時に追いかけていました。
2024年秋、米国カリフォルニア大学サンフランシスコ校の内科教授、グルプリート・ダリワルは、ハーバード大学医学部が開発したAIエージェント「Dr. CaBot」と並んで、同一の複雑な症例に取り組みました。二者はともに正しい診断に到達しました。ただし、歯ブラシが腸を突き破って感染を引き起こしたという根本原因を特定したのは、ダリワル医師だけでした。「以前に同じようなケースを見たことがある」——その経験の蓄積が、最後の一手を分けたのです。
診断エラーという「見えない危機」
この一場面は、医療の世界で静かに進行している、しかし決して小さくない問いを浮かび上がらせます。それは「AIは、最も優れた診断医と肩を並べられるのか」という問いです。
米国では毎年約10億回の外来診察が行われています。医師の診断正答率はおよそ90%とされていますが、それでも37万1,000人が誤診によって死亡し、42万4,000人が障害を負うと、2023年の研究は推計しています。2015年に米国科学・工学・医学アカデミーが発表した報告書は、「ほとんどの人が生涯に少なくとも一度は誤診を経験する」と指摘しました。この数字は、医療の質を問い直す出発点となっています。
ダリワル医師は、こうした現状に正面から向き合ってきた医師のひとりです。彼は「診断の名人」という称号を周囲から与えられながらも、それを「哲学的な理由から受け入れられない」と語ります。診断プロセスを極めることは不可能であり、自分はあくまで「診断の学習者」だという姿勢を崩しません。彼が実践してきたのは、自分の判断を記録し、結果を追跡し、間違いがあれば「なぜ間違えたか」を徹底的に掘り下げることです。疲労していたのか、早まった結論に飛びついたのか、重要な手がかりを見落としたのか。
「心は結末を求める。結果を知らなければ、うまくいったと思い込んでしまう」——ダリワル医師のこの言葉は、医療だけでなく、あらゆる専門的判断の盲点を突いています。
AIは「名医の代替」になれるのか
2024年7月に発表された研究では、OpenAIのGPT-4が救急外来の患者100人の医療情報を分析し、97%の正答率で診断を下したと報告されています。これは研修医を上回る成績です。別の研究では、ChatGPTが2つの学術医療センターの内科研修医・指導医よりも高い臨床推論スコアを記録しました。
ただし、研究結果は一様ではありません。AIの「信頼性」「迎合性(ユーザーが聞きたいことを言う傾向)」「幻覚(事実に反する情報を生成すること)」に関する懸念は、依然として解消されていません。さらに、2025年の研究では、大腸内視鏡検査でAIツールを3か月使用した医師が、その後自力でポリープを発見する能力が低下したという結果も報告されています。道具への依存が、人間の技能を摩耗させる可能性——これは医療に限らず、多くの職域で問われている問題です。
ダリワル医師自身は、AIの影響について落ち着いた見方をしています。「AIは医療を根本から変えるだろう。しかし、医師という職業を根本から変えることはないと思う」。彼の見立てでは、AIが最も力を発揮するのは「両極端」の領域です。一方は、虫刺されや軽い咳のような日常的な症状の確認。もう一方は、医師が生涯に一度も遭遇しないような希少疾患の特定。その中間にある「泥臭い中間地帯」——感染症か、アレルギーか、自己免疫疾患か、精神的なものか医学的なものか——こそが、医療の大半を占め、そこでは人間の判断がまだ不可欠だと言います。
日本社会への問い——「医師不足」とAIの接点
日本にとって、この議論は特に切実な意味を持ちます。日本は世界でも有数の高齢化社会であり、医師不足、特に地方における一次医療の担い手不足は深刻な課題です。米国では1億人以上がかかりつけ医を持たないと言われていますが、日本でも地域間の医療格差は拡大しています。
AIが日常的な診断を担えるようになれば、医師は「より人間的な部分」——患者の価値観を聞き、治療方針を共に決め、不安に寄り添う——に集中できるかもしれません。同じがんと診断された二人の患者が、まったく異なる治療方針を選ぶことがあります。積極的な治療を望む人もいれば、生活の質を優先して延命治療を断る人もいる。その選択に伴走することは、統計的パターン認識とは本質的に異なる行為です。
一方で、日本の医療文化には「医師への高い信頼」という特性があります。AIの診断をどこまで受け入れるか、あるいは「AIが言うから正しい」という過信が生まれないか——文化的な文脈での受容のあり方も問われています。富士通やNEC、医療スタートアップ各社がAI診断支援ツールの開発を進める中、技術の実装と社会的受容のバランスをどう取るかは、日本独自の課題でもあります。
カナダ・ダルハウジー大学の認知エラー研究で知られるパット・クロスキー名誉教授は、「医学における思考の仕方は、医学教育において長らく軽視されてきた分野だ」と指摘します。診断の質を上げるためには、AIの導入だけでなく、医師自身の「考え方を鍛える教育」が不可欠だという視点は、日本の医学教育にも問いを投げかけています。
記者
関連記事
数十年にわたり「薬の墓場」と呼ばれてきた膵臓がん治療に、KRAS標的薬やAI診断など複数のブレークスルーが重なり始めた。日本の高齢化社会にとって何を意味するのか。
線維筋痛症、IBS、慢性疲労症候群——現代医学が「標的」を見つけられない病に苦しむ患者と医師の現実。日本の高齢化社会が直面する静かな医療の限界を読み解く。
人型ロボットが世界中で話題を集めている。AIの進化が後押しする中、日本の高齢化社会と製造業にとって何を意味するのか。ハイプと現実の間を冷静に読み解く。
米国の出生率が過去最低を更新。しかし問題の本質は「産ませる」ことではなく、少ない子どもと多くの高齢者が共存する社会をどう設計するかにある。日本が先行する課題を世界が追いかけている。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加