生成AIの法的リスクと対策|AIキャラクターに著作権はある? 違反したらどうなる? 弁護士に聞いた
生成AIの「開発・学習」段階におけるリスクのポイント
生成AIの法的リスクの大枠を整理したところで、利用段階に応じた法的リスクのポイントをまとめたい。生成AIの利用段階は4つに分類されると上述したが、(1)大規模言語モデルを作成する段階については解説を省く。大多数の企業や個人が一から大規模言語モデルを開発するのは、到底無理であるためだ。 ここでは、(2)ファインチューニングをする段階の解説に集約する。前提として、ベースとする生成AIは誰もが利用できるオープンソースではなく、独自のAIモデルを生成するプライベート仕様を活用することとする。ここで配慮すべきは、「学習に用いるデータ」である。個人情報や著作物の情報を利用する際は、注意が必要だ。 次に、いくつかの例とその回答を示す。 ■ [例] 社内向けに生成AIをファインチューニングする際、社員や顧客の個人情報を利用していい? →利用目的を公表し、その範囲で使用すればOK 基本的に「個人情報」は利用目的を公表して、その範囲内で使えば問題はないとのこと。他方で、個人情報をデータベース化した「個人データ」については、第三者提供が禁止されている。もし第三者に提供したい場合は、原則、本人の同意が求められる。ただし「業務委託」の場合は、同意が必要ない。たとえば、社員の個人情報のデータベースを人事コンサルタントに提供する場合、業務委託であれば同意がなくてもOKとなる。 ■ [例] 一般公開する生成AIサービスを開発する目的でファインチューニングする際、他人の著作物を著作権者の許諾なしに利用してもいい? →「享受目的」でなければOK 著作物とは、「思想や感情を創作的に表現したものであり、文学、学術、美術、または音楽の範囲に属するもの」とされている。具体的には、小説、論文、音楽、写真、絵画、彫刻、建築、映画などが含まれる。著作権法30条の4では、著作物を生成AIの開発・学習に利用するにあたり、「享受」を目的としないケースに関しては著作権者の許諾なしに利用できると規定されている。次の文化庁ホームページの説明も参考にしてほしい。 ┌────────── 著作物は,技術の開発等のための試験の用に供する場合,情報解析の用に供する場合,人の知覚による認識を伴うことなく電子計算機による情報処理の過程における利用等に供する場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には,その必要と認められる限度において,利用することができることを規定しています。これにより,例えば人工知能(AI)の開発のための学習用データとして著作物をデータベースに記録する行為等,広く著作物に表現された思想又は感情の享受を目的としない行為等を権利者の許諾なく行えることとなるものと考えられます。 (文化庁のホームページより) └────────── 「享受」とは、視聴者等の知的・精神的欲求を満たすという効用を得ること(つまり、味わい楽しむこと)に向けられた行為であり、文章であれば読む、美術・音楽・映画であれば鑑賞する、プログラムであれば実行することが、これに当たる。著作物を機械学習の学習用データとして利用する行為は、享受にあたらないと考えられるそうだ。 とはいえ、もっとも安全なのは著作物を使わない、または許諾済みの著作物を活用することだ。たとえば、アドビが提供しているAdobe Fireflyは、オープンライセンスなど著作権の問題のない画像を学習段階で利用している。そのため生成AIの学習に使う画像データをAdobe Fireflyで用意するなどは安全な方法だ。