「フェイクの風評被害」「データ漏洩」チャットGPTに米政府が調査、その問題点とは?
「フェイクの風評被害」「データ漏洩」を巡りチャットGPTに米政府が調査に乗り出す――。
ワシントン・ポストは7月13日、米連邦取引委員会(FTC)がオープンAIに対し、チャットGPTの消費者保護をめぐる問題について質問書を送り、詳細な回答を求めていると報じた。
調査は、個人に関するフェイク情報の生成による風評被害から、3月に明らかになったユーザー情報の漏洩まで、20ページ、49項目に上る。
フェイク情報による風評被害を巡っては、米国で訴訟も起こされている。また、ユーザー情報の漏洩では、イタリア政府が約1カ月にわたって国内でのチャットGPT使用停止を命じた経緯がある。
チャットGPTは安全に使えるのか? その問題点とは?
●チャットGPTのデータ漏洩
ワシントン・ポストが7月13日付で報じたFTCによるオープンAIに対する質問書は、調査の趣旨についてそう述べている。
20ページ、49項目にわたる質問項目は、多岐にわたる。
その第1のポイントとされているプライバシー、データセキュリティの問題が大きな注目を集めたのは、2023年3月20日に発生したユーザーの利用履歴の漏洩騒動だ。
騒動は、他人のチャット履歴のタイトルが表示された、との報告がソーシャルメディア上に相次いで投稿されたことから表面化。
オープンAIによる調査の結果、同じ不具合によって、有料のチャットGPTプラスのユーザーの1.2%で、氏名、メールアドレス、住所、クレジットカード番号の下4桁と有効期限が、9時間にわたって他のユーザーに表示された可能性があった、という。
この騒動をきっかけとして、イタリアの個人データ保護庁(GPDP)は3月末から約1カ月にわたり、チャットGPTの国内での利用停止を命じた。
FTCは、このデータ漏洩を今回の調査の第1の問題として突き付けている。
●フェイクの風評被害
第2点としてFTCが指摘しているのが、風評被害だ。
チャットGPTなどの生成AIのリスクとして指摘されてきたのが、もっともらしいフェイク情報を作成する「幻覚」だ。
そして、チャットGPTが特定の個人に関するフェイク情報を生成したとして、問題化しているケースもある。
米国ではジョージア州のラジオパーソナリティのマーク・ウォルターズ氏が、チャットGPTによって関係のない団体の「財務担当者」として「詐欺と横領に問われている」とされ、名誉を毀損された、と主張。
6月に開発元のオープンAIを相手取った訴訟を起こしている。
※参照:「チャットGPTに横領犯にされた」名誉毀損訴訟が示すAIリスクとは?(06/12/2023 新聞紙学的)
これ以前にも、複数の騒動が明らかになっている。
4月には、ジョージ・ワシントン大学法科大学院教授で、保守派のコメンテーターとして知られるジョナサン・ターリー氏について、チャットGPTが「女子学生に対するセクシャルハラスメントを行ったと、ワシントン・ポストが報じた」との回答をしたことが表面化した。
ターリー氏は、オピニオン・コラムニストを務めるUSAトゥデイのコラムでこの騒動を取り上げ、引き合いに出されたワシントン・ポストも批判記事を掲載した。
また同月、オーストラリアでは、国際贈収賄事件の内部告発者だった自治体首長、ブライアン・フッド氏について、チャットGPTが「贈賄側企業の元幹部」として有罪判決を受けた人物、との事実に反する回答をしていたことが判明している。
※参照:「ChatGPTが私を犯罪者と呼んだ」内部告発者を呆然とさせ、提訴に向かわせたそのわけとは?(04/07/2023 新聞紙学的)
FTCは、このようなフェイク情報による被害の現状や対策についても、オープンAIに問いただしている。
●データはどこから
さらにFTCは、チャットGPTの学習データについても、詳細な報告を求めている。
オープンAIは、チャットGPTの前身、GPT-3については、ウェブサイトなどから集めた570ギガバイトに上る学習データの概要については公開している。
だがチャットGPTの学習データについては一切、明らかにしていない。
一方、ワシントン・ポストは4月、グーグルが公開する「C4」と呼ばれる学習データを分析している。
それによると、ワシントン・ポストなどのメディアのデータは全体の13%を占め、収集元のトップ10のうち5つ(ニューヨーク・タイムズ、ロサンゼルス・タイムズ、ガーディアン、フォーブス、ハフポスト)がメディアサイトだった。当のワシントン・ポストも11位に入っていた。
※参照:チャットAIの「頭脳」をつくるデータの正体がわかった、プライバシーや著作権の行方は?(04/24/2023 新聞紙学的)
学習データの扱いは、有害な回答への対策の焦点となることに加え、著作権侵害の懸念も指摘されてきた。
米国メディアの業界団体「ニュース/メディア連合」は、4月20日に「AI原則」を公開。「コンテンツを使用する権利についてメディアと協議する必要がある」と述べている。
そんな中でAP通信は7月13日、オープンAIと学習データにおけるニュースコンテンツのアーカイブについてライセンス契約を結んだことを明らかにした。
両者の共同声明は、そう述べている。
このほかにも、フィナンシャル・タイムズは6月、オープンAI、グーグル、アドビなどのIT企業が、AIの学習データにおけるニュースコンテンツの著作権使用料を巡り、ニューズ・コープ、アクセル・シュプリンガー、ニューヨーク・タイムズ、ガーディアンなどのメディア企業と協議中であると報じている。
●FTCの立ち位置
ワシントン・ポストによるFTCのオープンAIへの調査のニュースが報じられた7月13日、同委員長のリナ・カーン氏は下院司法委員会の公聴会で証言に立っていた。
その中で、名誉毀損などの事案は州法の対象ではないか、との質問を受け、カーン氏はこう答えたという。
巨大IT企業に対する監視を強めるFTCは、逆風の中にもある。
米マイクロソフトが計画中のゲーム企業、アクティビジョン・ブリザード買収の差し止めを求めていたFTCの訴えが、公聴会の前日に、米連邦地裁で退けられたばかりだ。FTCは控訴している。
その翌日に、マイクロソフトが出資するオープンAIへのFTCの調査が報じられ、カーン氏が下院公聴会に立つという、切迫したタイミングでもあった。
●リスクと透明性
チャットGPTは2022年11月末の公開以来、世界的なインパクトをもたらし続けている。
データ漏洩、風評被害、学習データなど、これまでオープンAIが十分には明らかにしてこなかった実態や対策の透明化。
これは、ユーザーとしても是非知りたいところだ。
(※2023年7月14日付「新聞紙学的」より加筆・修正のうえ転載)