「機械学習パラダイス」の日本、AIと著作権をめぐる議論の現在地。上野達弘さんインタビュー前編
学習段階でも著作権侵害にあたる可能性がある? 文化庁が示した考え方とは
―イラストや映像の生成AIが急速に普及していますし、著作権侵害ともとれるイラストもネット上に流布されています。そんな状況で3月に公表された文化庁の「考え方」では、学習段階で著作権侵害にあたる可能性がある行為が示されたことが注目されました。具体的に、どのような行為がNGかもしれないと示唆されているのでしょうか? 上野:一つ目はいわゆる「享受目的併存型」というものです。先ほど説明したように情報解析は基本的には「非享受利用」とされていますが、享受目的と非享受目的が併存する場合は純粋な非享受利用とは言えませんので、30条の4は適用されません。 たとえば、生成AIの開発のためだといっても、その生成AIが学習元著作物の創作的表現をそのまま出力してしまうことをはじめから意図しているような場合です。画像生成AIでも、出力される画像に学習元画像の一部がそのまま出てきてしまう場合のように、単なる作風やスタイルではなく、元の著作物の創作的表現がそのまま出力されるようなAIを開発する場合、30条の4は適用されないのです。 二つ目は議論が分かれる点でもあるのですが、特定のクリエイターのスタイルを真似するためにそのコンテンツを「狙い撃ち」で学習する場合です。この場合でも、出力されるコンテンツが学習元コンテンツと作風やスタイル、世界観において共通するだけでは著作権の侵害になりませんし、そうである以上、そのための学習も適法だというのが通説です。 しかし、たとえ出力されるコンテンツが学習元コンテンツのスタイルや作風のレベルでしか共通しない場合であっても、特定のクリエイターを狙い撃ちにして学習し、これと共通のスタイルで大量のコンテンツを出力する場合は、30条の4が適用されない場合もありうる、という意見が委員のなかで一定数ありました。 たしかに、著作権法30条の4の規定には、「権利者の利益を不当に害する場合はこの限りでない」という但し書きがあります。AIによって勝手に自分のスタイルの作品が大量に生み出され、仕事がなくなってしまったという場合には、このただし書きにあたる場合があるのではないかという考えです。少数説ではありますが、このことが文化庁の「考え方」にも書かれています。 三つ目は新聞記事データベースに関するものです。 上野:たとえば、新聞社が大量の新聞記事を情報解析に適したかたちで整理したデータベースをAI事業者に提供しているとします。そのような中、AI事業者が契約して解析用データベースにアクセスするのではなく、ネット上にフリーで置かれている新聞記事を大量に集めた結果、その解析用データベースと同じものをコピーしたと評価できるような場合は、先ほど説明した但し書きの「権利者の利益を不当に害する」と言える場合が考えられるということが書かれているのです。 一方で、この点を「まるめて」伝える報道に接した人の中には、新聞記事の機械学習には情報解析規定が適用されず、つねに著作権侵害にあたると考えてしまう人が出てきてしまいはしないか気がかりでもあります。あくまで、「考え方」が問題にしたのは記事データベースの著作権の話であって、記事の著作権の話ではありませんし、解析用データベースの話も実際にはかなり限定的な場合と考えられます。大量の新聞記事を偏りなく学習することは適切なAI開発のためにも重要ですので、「考え方」を誤解して、新聞記事を用いた情報解析が過度に萎縮してしまわないように注意する必要があるかと思います。
インタビュー・テキスト by 廣田一馬、生田綾