Metaがフェイスブックとインスタグラムの「投稿データ」を生成AIの開発に活用…「機械学習用データ」の枯渇が背景に
禁を破って自前のデータに手をつける
こうした情勢の変化を受け、メタはこれまでの言わば禁を破って「自前のデータ源」とも言えるSNS上の投稿に手をつけたと見ることができる。ただし全ての個人データが使われるわけではない。 Meta AIの機械学習に使われるのは、フィード機能などで一般公開されるテキストや写真、動画などの公開データに限定される。従って、それがもし嫌ならユーザーはプライバシー設定を変更して、それらのデータを「公開」から「自分のみ」や「友達」等に変更すればAIの機械学習に使えなくなる。 こうした動きは実はメタに限った事ではない。グーグルも昨年夏頃、Google DocsやGoogle Sheetsなどオフィス用サービスの利用規約を改訂して、これらのデータが同社の生成AIに利用可能になる旨を明記したとニューヨーク・タイムズなど米国メディアが報じている(ただし実際には、それらのデータはAIの機械学習には未だ使われていないようだ)。 また(グーグルの親会社)アルファベット傘下のユーチューブ上の動画なども、同社の生成AIの機械学習に利用可能となった模様だ。 ただ、メタにせよグーグルにせよ、本来それらのデータの著作権はユーザーに帰属しているため、たとえ利用規約に明記したとしても、それをAIの機械学習に使えるかどうかは法的にはグレーゾーンにあるとされる。 これと関連してくるが、昨年辺りから米国ではOpenAIやマイクロソフト、メタなどを相手に著作権侵害を理由に提訴する動きが始まっている。(近い将来始まるであろう)これらの裁判では、画像やテキストなど各種コンテンツを無断で生成AIの機械学習に利用する行為が米国の著作権法における「フェア・ユース(公正利用)」に該当するかどうかが争われることになる。 このフェア・ユースと同様の例外規定は、呼称こそ違え日本をはじめ各国の著作権法にも記されている。今後米国の裁判の行方次第では、現在の生成AIのビジネス・モデルが成立しなくなるとの厳しい見方も一部専門家の間では囁かれている。
小林 雅一(作家・ジャーナリスト)