医学界に大激震…ChatGPTは「医師よりも正確に病気を診断」する!権威あるアメリカ医学論文誌に発表された「驚きの調査結果」
ChatGPTが病気を診断する能力は現役の医師を遥かに凌ぐ ―― そんな調査結果(論文)が最近、米国の権威ある医学専門誌「JAMA(Jounal of the American Medical Association)」に発表され、医師らの間で計り知れない衝撃が広がっている。 【画像】なぜこんなに違いが?都道府県別「がんの死亡率・罹患率」ランキング
ChatGPTの診断精度は医師を16%上回る
この論文を発表したのは、名門スタンフォード大学やハーバード大学の医学大学院、さらにはベスイスラエル・ディーコネス医療センターなど先端的な総合病院に勤務する16名の研究医からなる調査チーム。 彼らは米国の主要病院に勤務する内科医、家庭医、救急医らから50人をランダムに抽出して、今回の調査の被験者に選んだ。これらの中には、医師免許を取得して間もない研修医(resident)から働き盛りの主治医(attending physician)まで、さまざまなレベルが含まれる。 これらの被験者(医師)に、過去にさまざまな病気で入院した患者らの症例データ(各種病気の症状が詳しく記述された診察記録)を見せて、それを基に病気(病名)の診断をさせた。すると(診断する際に)ChatGPTを一種のアシスタントとして利用した医師の正答率が76パーセントであったのに対し、ChatGPTを利用しなかった医師では同74パーセントとほとんど差が見られなかった。 ところが全く同じ症例データをまるごとChatGPTに入力して診断させたところ、その正答率は90パーセントに達したという。つまり現役の医師を除外して、むしろChatGPTに診断を丸投げした方が遥かに高い確率で正しく病気(病名)を言い当てることができる、ということだ。 このショッキングな調査結果(論文)がJAMAに発表されたのは今年10月だが、実際にこの調査が実施されたのは2023年11~12月にかけてだ。同調査で用いられたChatGPTの基盤となるLLM(大規模言語モデル)は「GPT-4」である。 しかし、それから約1年が経過した今、ChatGPTのLLMは当時のGPT-4から「GPT-4o」や「o1」など、より学習量が多く推論能力に富む強力な最新モデルに切り替わっている。同じ調査チームがその後実施した、これら最新モデルのChatGPTを使った調査結果も、間もなく論文として発表される予定だ。 この論文では恐らく、ChatGPT単独による病気診断は(約1年前に記録された)90パーセントを遥かに上回る正答率を示すと見られている。ちなみに米国のシンクタンクが今年夏に実施した同様の調査では、ChatGPT-4oは米国の医師国家試験で98パーセントの正答率を記録している。