Yahoo!ニュース

【最新研究】ChatGPTは医師の代わりになるか?血液検査の解釈に関する比較調査の結果

大塚篤司近畿大学医学部皮膚科学教室 主任教授
(写真:イメージマート)

【AIチャットボットの医療現場での活用可能性】

近年、ChatGPTをはじめとするAIチャットボットの登場により、医療分野でのAI活用に注目が集まっています。特に、AIが医師国家試験に合格したというニュースは大きな話題となりました。そこで、ドイツの研究チームが、オンラインヘルスフォーラムにおける患者の質問に対し、AIチャットボットと医師の回答を比較する興味深い研究を行いました。

研究では、3種類のAIチャットボット(ChatGPT、Gemini、Le Chat)と医師の回答を比較しました。対象となったのは、オンラインフォーラムに投稿された、血液検査(CBC)の解釈に関する100の患者の質問です。CBCとは、赤血球、白血球、血小板などの血液細胞の数や状態を調べる検査です。

結果は、AIチャットボットの回答は医師に及ばないというものでした。チャットボットは患者への共感を示すコミュニケーション能力は高いものの、複雑な質問に対しては誤った回答や過度に一般化した回答をすることが多かったのです。チャットボットの回答の適切さは51~64%で、22~33%は患者の状態を過大評価していました。一方で、医学的な立場ではないことを明示し、専門家への相談を勧めるなどの配慮は一貫して見られました。

【皮膚疾患診断へのAIチャットボット活用の課題】

今回の研究は血液検査の解釈に関するものでしたが、皮膚疾患の診断においてもAIチャットボットの活用が期待されています。しかし、皮膚疾患の診断は視覚的な情報が重要であり、チャットボットでは限界があるのが現状です。

皮膚疾患の診断では、皮疹の色、形、分布などを総合的に判断する必要があります。また、患者の年齢、性別、既往歴なども考慮しなければなりません。チャットボットでは、こうした多角的な評価が難しいと考えられます。

加えて、皮膚疾患には多様な種類があり、それぞれに特徴的な所見があります。例えば、尋常性乾癬では紅斑、鱗屑、肥厚などが見られ、アトピー性皮膚炎では湿疹、びらん、苔癬化などが特徴的です。チャットボットがこうした多様な所見を適切に判断するのは容易ではありません。

【医療AIの発展に向けて】

今回の研究は、医療現場でのAI活用における課題を浮き彫りにしました。AIチャットボットの回答は一見説得力がありますが、その正確性には注意が必要です。特に、患者の自己診断への安易な利用は危険です。

一方で、AIは医療従事者の負担軽減や、患者とのコミュニケーション改善に寄与する可能性があります。例えば、初診時の問診や、検査結果の説明などにAIを活用できるかもしれません。ただし、その際は医療従事者がAIの回答を適切に監修する必要があるでしょう。

皮膚科領域でも、AIを用いた画像診断システムの開発が進んでいます。スマートフォンで撮影した皮疹の写真から、AIが疾患を推定するようなアプリも登場しつつあります。ただし、現時点ではあくまで補助的なツールであり、最終的な診断は医師の判断に委ねられます。

医療分野でのAIの活用は、まだ発展途上の段階にあります。AIの長所を生かしつつ、短所を補うような、人間とAIの協働が求められます。そのためには、AIの特性や限界を正しく理解し、倫理的、法的な課題にも対応していく必要があるでしょう。

参考文献:

1. Meyer A et al. Comparison of ChatGPT, Gemini, and Le Chat with physician interpretations of medical laboratory questions from an online health forum. Clin Chem Lab Med 2024. https://doi.org/10.1515/cclm-2024-0246.

近畿大学医学部皮膚科学教室 主任教授

千葉県出身、1976年生まれ。2003年、信州大学医学部卒業。皮膚科専門医、がん治療認定医、アレルギー専門医。チューリッヒ大学病院皮膚科客員研究員、京都大学医学部特定准教授を経て2021年4月より現職。専門はアトピー性皮膚炎などのアレルギー疾患と皮膚悪性腫瘍(主にがん免疫療法)。コラムニストとして日本経済新聞などに寄稿。著書に『心にしみる皮膚の話』(朝日新聞出版社)、『最新医学で一番正しい アトピーの治し方』(ダイヤモンド社)、『本当に良い医者と病院の見抜き方、教えます。』(大和出版)がある。熱狂的なB'zファン。

大塚篤司の最近の記事