皮膚トラブルをAIに判断させるとどうなる?ChatGPTの性能を皮膚科医が評価
【AIによる皮膚疾患診断の現状と課題】
近年、人工知能(AI)技術の発展に伴い、医療分野でもAIの活用が期待されています。皮膚科領域においても、AIを用いた皮膚疾患の診断支援ツールの開発が進められていますが、その精度や有用性についてはまだ十分な検証が必要とされています。
最新の研究では、大規模言語モデル「ChatGPT」の画像分析機能を用いて、15種類の皮膚疾患の診断精度を評価しました。
研究チームは、デンマークのウェブアトラス「Danderm」から選んだ、尋常性乾癬や悪性黒色腫など15種類の皮膚疾患の画像をChatGPTに入力し、診断名や治療法の提案を求めました。その解答を、皮膚科の専門医23名が「関連性」「正確性」「深み」の3つの観点から5段階で評価しました。
その結果、ChatGPTの解答の総合評価の中央値は5点満点中2点にとどまり、半数以上の疾患で「関連性が低い」「表面的である」「誤りを含み、害を及ぼす可能性がある」といった評価が下されました。特に「化膿性汗腺炎」「酒さ」「多形紅斑」などの疾患では、評価が1点と最低レベルでした。一方、尋常性乾癬や悪性黒色腫などでは比較的高い評価が得られました。
今回の研究結果から、現時点でのChatGPTを含むAIモデルの画像診断能力は、皮膚科専門医のレベルには及ばないことが明らかになりました。AIによる誤診や不適切な治療法の提案は、患者に心理的負担をかけたり、副作用のリスクをもたらしたりする恐れがあります。AIを医療に導入する際は、その限界を十分に理解し、専門医の監督下で慎重に運用することが求められるでしょう。
【皮膚科医療におけるAIの可能性】
一方で、AIには皮膚科医療の発展を支える大きな可能性も秘められています。例えば、AIを用いることで、大量の皮膚病変の画像データを短時間で解析し、早期発見や診断の補助に役立てることができるかもしれません。また、遠隔地の患者に対して、AIを活用した初期診断や治療アドバイスを提供することで、医療アクセスの向上につながる可能性もあります。
ただし、AIを医療現場で活用するためには、その安全性と有効性を十分に検証し、倫理的・法的な課題をクリアしていく必要があります。また、AIはあくまでも医療従事者の判断を補助するツールであり、最終的な診断と治療方針の決定は専門医の責任で行われるべきです。
【今後の展望と課題】
皮膚科領域でのAI活用は、まだ発展途上の段階にあります。今後は、AIモデルの精度向上を目指した研究開発とともに、医療従事者とAI開発者が協力して、AIを医療現場に効果的に導入していくための指針づくりが求められます。また、患者や国民に対して、AIの可能性と限界について正しい理解を促していくことも重要な課題と言えるでしょう。
皮膚は、私たちの身体を外界から守る重要な役割を担っています。皮膚疾患は、患者のQOL(生活の質)に大きな影響を及ぼす一方で、早期発見・早期治療が予後の改善につながることが知られています。AIを活用することで、皮膚疾患の診断や治療がより効率的かつ効果的になることを期待したいと思います。ただし、AIの導入に際しては、常に患者の安全と利益を最優先に考え、倫理的な配慮を怠らないことが肝要です。
参考文献:
1. Nielsen JPS, et al. (2024) Usefulness of the large language model ChatGPT (GPT-4) as a diagnostic tool and information source in dermatology. JEADV Clin Pract. 1-6. https://doi.org/10.1002/jvc2.459
2. Mirza FN, et al. (2024) Performance of three large language models on dermatology board examinations. J Invest Dermatol. 144(2):398-400. doi:10.1016/j.jid.2023.06.208