人工知能が医学論文を書く時代に!ChatGPTの可能性と限界を探る
ChatGPTをはじめとする大規模言語モデル(LLM)が急速に発展し、科学論文の執筆にも活用されるようになってきました。実際に、コンピューターサイエンスの分野では、arXivに掲載された論文要旨の35%がChatGPTを使って書かれたと推定されています。
LLMは膨大なテキストデータを学習することで、人間のような文章を生成し、言語を翻訳し、様々なクリエイティブなコンテンツを作成できます。研究者たちは、ライターズブロックを克服したり、複雑な情報を要約したり、論文の草稿を作成したりするために、これらのモデルを活用しています。
しかし、科学論文の執筆にLLMを使うことには、課題もあります。
【医療分野におけるAI活用の注意点】
医療分野では、情報の正確性と患者の安全性が何よりも重要です。LLMは品質の異なる大量のデータを学習しているため、生成されたテキストの正確性と信頼性を保証することが難しいのです。
実際に、ChatGPTによるがん治療の推奨を評価した研究では、34.3%の出力に正しい情報と並んで、少なくとも1つの不一致な提案が含まれていました。正確な情報と不正確な情報が混在していることは、LLMに盲目的に頼ることの危険性を浮き彫りにしています。
医療分野でのAI活用は、人間とAIのパートナーシップを重視したバランスの取れたアプローチが不可欠だと考えます。人間が批判的な評価者・編集者としての役割を果たし、LLMが生成したコンテンツの正確性、独創性、倫理的な影響を確認する必要があるでしょう。
【ChatGPTを使った医学論文の質と効率】
Giavina Bianchiらの研究グループは、アトピー性皮膚炎の症例報告を人間、AI、人間とAIの協働で作成し、それぞれの文章の質や効率を比較しました。
その結果、AIと人間の協働で作成された論文は、人間だけで書かれた論文と比べて、13.9%の品質向上(P<0.001)と83.8%の執筆時間短縮を実現しました。AIだけで作成した論文も、人間の論文に比べて11.1%の品質向上(P<0.001)と84.3%の時間短縮を示しました。
ただし、AIだけで生成された論文の参考文献は専門家から最も低い評価を受け、出版の障害となる可能性が示唆されました。人間の監督の下で、AIを適切に活用することが重要だといえるでしょう。
【皮膚科医としてのAI活用への期待と懸念】
皮膚科医の立場から、医療分野でのAI活用には大きな期待を寄せています。例えば、皮膚がんの診断や皮膚病変の分類など、AIを用いた画像解析は診断の精度向上に貢献すると考えられます。
一方で、AIが生成した情報をそのまま鵜呑みにすることの危険性も認識しておく必要があります。特に、アトピー性皮膚炎など慢性的な皮膚疾患の治療では、患者一人ひとりに合わせたきめ細やかなアプローチが求められます。AIが提案する画一的な治療法には注意が必要でしょう。
医療分野におけるAIの活用は、人間の専門知識と経験に基づく判断力を補完するものであり、決して代替するものではありません。AIの可能性を活かしつつ、その限界も理解し、人間とAIが協調して医療の質を高めていくことが大切だと考えています。
参考文献:
Giavina Bianchi M, D'Adario A, Giavina Bianchi P, Machado BS. Three versions of an atopic dermatitis case report written by humans, artificial intelligence, or both: Identification of authorship and preferences. Journal of Allergy and Clinical Immunology Global. 2025;4:100373.