AIが医師を超えた日：67%対55%が示す未来

ハーバード大学とベス・イスラエル医療センターの研究で、OpenAIのo1モデルが救急診断で医師を上回る精度を記録。Science誌掲載の最新研究が示す医療AIの現在地とは。

救急室のトリアージで、AIは医師より正確な診断を下せるのか。その答えが、世界トップクラスの医学誌に掲載されました。

何が起きたのか：数字が語る事実

2026年、ハーバード大学医学部とベス・イスラエル・ディーコネス医療センターの研究チームが、科学誌『Science』に注目の研究を発表しました。実際の救急患者76名のカルテデータを用い、OpenAIの「o1」および「4o」モデルと、現役の指導医2名の診断精度を比較したのです。

結果は明確でした。救急トリアージの初期段階において、o1モデルは67%のケースで「正確またはほぼ正確な診断」を提示。対して人間の医師は一方が55%、もう一方が50%にとどまりました。評価は別の指導医2名が担当し、どの診断がAIによるものかを知らない状態で行われました。いわゆる「ブラインドテスト」です。

研究の重要な点は、データの前処理を一切行っていないことです。AIには電子カルテに記録された情報がそのまま提供されました。「あらゆるベンチマークでAIモデルをテストしたが、過去のモデルも医師のベースラインも上回った」と、研究の共同主著者でハーバード大学AIラボを率いるArjun Manrai氏は述べています。

「AIが医師を超えた」は正確か

ただし、研究チーム自身が強調しているのは、この結果をもって「AIが医療現場に即座に導入できる」とは言えないという点です。

広告掲載について

[email protected]

研究が扱ったのはテキストベースの情報のみであり、画像診断や患者の表情・様子といった非テキスト情報の処理には、現在の基盤モデルには限界があると論文は指摘しています。また、共同著者のベス・イスラエルの医師Adam Rodman氏は英ガーディアン紙に対し、「AI診断に関する説明責任の正式な枠組みが現時点では存在しない」と述べ、「患者は生死に関わる決断や困難な治療の選択において、人間に導いてもらいたいと望んでいる」と語りました。

研究が求めているのは「AIの即時導入」ではなく、「実際の診療環境での前向き試験の実施」という、次のステップへの呼びかけです。

日本医療への問い：人手不足とAIの交差点

この研究が日本にとって持つ意味は、他の国とは異なる文脈で読む必要があります。

日本は世界でも類を見ない速度で高齢化が進んでおり、2040年には医師不足が深刻化すると厚生労働省は予測しています。特に地方の救急医療現場では、すでに人員不足が慢性化しています。そのような状況において、初期トリアージの補助ツールとしてAIを活用することは、現実的な選択肢として浮かび上がります。

一方で、日本の医療文化には「医師と患者の信頼関係」を重視する強い傾向があります。診断をAIが行うことへの心理的抵抗感は、米国とは異なる形で現れる可能性があります。また、日本の医療機器規制（薬機法）の枠組みでAI診断ツールをどう位置づけるかという制度的な課題も残ります。

ソニーや富士フイルム、NECなど、医療AIに投資する日本企業にとっては、今回のような研究結果が市場の期待値を引き上げる可能性があります。ただし、実際の臨床導入には規制当局との対話と、医療従事者の信頼獲得という二重のハードルが存在します。