有名人そっくり、増え続けるAI音声 “声の権利”どう守る
「ChatGPT」に搭載された「Sky」という合成音声が、スカーレット・ヨハンソンさんに似ていると騒ぎになった。一方、日本では、声優の梶裕貴さんが「人間とAIとの共存」のために、自らの生成AIを作るクラウドファンディングを開始した。「音声の権利」をめぐり、日米で対照的な動きが起きている。 【もっと写真を見る】
5月20日、AI界隈でスカーレット・ヨハンソンさんの事案が大注目されました。OpenAIが発表した「ChatGPT」新モデル(GPT-4o)に搭載された「Sky」という音声が“不気味にそっくり”ではないかと本人からツッコミが入ったのです。一方で、日本では、声優の梶裕貴さんが「人間とAIとの共存」のために、自らの生成AIを作るクラウドファンディングを始めました。 スカーレット・ヨハンソンさん「そっくりAI音声」に怒り ヨハンソンさんが出演した2014年に公開された『her/世界でひとつの彼女』は、離婚で孤独を抱えている男性が人工知能型OSに出会い、段々と恋愛感情を抱いていくという映画。アカデミー脚本賞も受賞しています。大規模言語モデル(LLM)の世界では、この映画で起きたような人間とAIとの関係性が発生し始めており、映画はAI理解のための基礎教養的な存在にもなってきています。ヨハンソンさんは、姿は登場せず、声だけのAIのサマンサ役を演じました。そのハスキーボイスは愛らしく、キャラクターへの説得感を生み出すのに重要な役割を果たしています。映画を見た多くの人が音声で語りかけるAIに出会えるなら、サマンサのような声で話しかけてほしいと思ったことでしょう。 OpenAIのサム・アルトマンCEOがGPT-4oの発表前に、「her」と一言だけ意味深につぶやいていて、何を意味するのかと話題を呼んでいました。結果的に映画で実現されている音声でのリアルタイム応答システムを発表する予告ではあったようです。 ところがGPT-4oの音声として発表された5種類の音声のうち、ハスキーな女性の音声Skyが、サマンサ──つまりヨハンソンさんに似ているというのが話題になりました。そして5月20日にヨハンソンさんがコメントを発表したのです。 ヨハンソンさんによると、2023年9月にOpenAIから声優としてのオファーを受けており、「悩んだ末、そして個人的な理由から、私はこのオファーを断った」としています。「公開されたデモを聴いたとき、私は衝撃を受け、怒り、そしてアルトマン氏が私の声と不気味なほど似ている声を追求することに不信感を抱きました。アルトマン氏は、私が人間と親密な関係を結ぶチャット・システム、サマンサの声を演じた映画にちなんで、『her』という一言をツイートし、その類似性が意図的なものであるとさえほのめかした」と書いています。 さらに、「ChatGPT4.0のデモがリリースされる2日前、アルトマン氏は私のエージェントに連絡し、再考を求めました。私たちが接触する前に、システムは世に出ていました」とコメント。その後、弁護士を雇い、アルトマン氏とOpenAIに音声を作成したプロセスを明らかにすることと、Skyの音声を削除することを求めました。 OpenAIは、GPT-4oにおいては、ヨハンソンさんの「懸念を尊重し」Skyのサービスを一時停止したと発表しました。ただし、日本のChatGPTアプリでは6月1日現在、Skyを選択することは可能です。そこで、劇中の「Hi, I’m Samantha」というセリフをGPT-4oに言わせてみました。サマンサ特有のハスキーボイスの雰囲気はあり、似せにいっている印象もありますが、同一人物の声かと言うと同じではなさそうだという印象を持ちました。 アルトマン氏は5月20日に、「スカイの声はスカーレット・ヨハンソンさんのものではありません。私たちは、ヨハンソンさんへの働きかけの前に、スカイの声を担当する声優をキャスティングしました。(略)ヨハンソンさんにはうまく伝えられなかったことをお詫び申し上げます」とのコメントを発表。OpenAIはブログを通じて、5月22日に声優を決定するための詳細なプロセスを明らかにしました。400人の応募者があり、最終的に5人を選出した後、2023年9月にその声をChatGPTに導入したとしています。 その上で、米ワシントン・ポスト紙に対し、OpenAIのAIボイスの開発に携わったジョアン・ジャン氏が声優の意思決定にはアルトマン氏がほとんど関わっていないこと、この声優の音声を長く聞いてきたものとしては、ヨハンソンさんの声に「似ても似つかない」というコメントを寄せています。 今後、この問題が継続し、裁判へ発展していくのかは、まだわかりません。 アメリカレコード協会の最高経営責任者であるミッチ・グレイジャーCEOは、「ヨハンソンさんが訴訟を起こせば、OpenAIに対して強力な訴えを起こす可能性がある」と述べています。アメリカでは、1988年に、モノマネ芸人が歌声をCMで再現したものに対する裁判で、真似られた歌手が勝訴したケースがあるようです。歌手のベット・ミドラー氏がフォード・モーター社を相手取って起こした訴訟で、ミドラーはアメリカの控訴裁判所で勝訴しており、このケースが当てはまるのではないかというわけです。ただし、アルトマン氏がヨハンソンさんの声を切望していたのは考えられますが、意識的に似せて開発したという証明をするのは、簡単ではないと考えられます。 また、SAG-AFTRA(映画俳優組合)は、ヨハンソンさんを支持するコメントを発表。「私たちは彼女の懸念を共有し、チャットGPT-4oの機能の『Sky』の開発で使用された音声に関して明確性と透明性を持つ彼女の権利を全面的に支持します」(プレスリリースより)としています。ただ、ヨハンソンさんの権利がどこまで及ぶのかが不明確なため、慎重な発言にとどめていました。アメリカでも、「声」の保護についての議論は続けられており、州法レベルでは保護を掲げる州も登場しているのですが、連邦法レベルではまだまだ議論はまとまっていないようです。SAG-AFTRAは、連邦法での新法制定による保護を求めています。 今回のケースは、有名人の声に似た声が許されるのかどうかというのが、焦点になっていますが、今後、そうでない人の声が使われていくことが普通になっていくと思われるため、こうした問題は起こりにくくなっていくとは思われます。実際、GPT-4oの残りの4人の声については、誰かに似ているといったことは、ほぼ話題になっていません。 人気声優・梶裕貴さん、自ら「音声AIプロジェクト」開始 一方、日本では対称的な動きが出てきました。 4月11日、人気声優の梶裕貴さんが自らの企画・プロデュースで「歌声合成プロジェクト【そよぎフラクタル】」を立ち上げ、自らの声を使った「歌声合成ソフト 梵そよぎ」の開発を発表。そのクラウドファンディングを開始しました。支援総額は、6月1日現在で3400万円を超え、当初目的の1000万円をすでに大きく上回っています。 公開されているデモ映像では、梶さんの声でトレーニングされたAIが自然に歌う様子、太宰治の小説「人間失格」を朗読として読み上げている様子が紹介されています。いずれも非常に品質が高く、ちょっと聞いただけでは、AI音声だとは気がつけないのではないかというクオリティーが実現されています。今のところ、最も人気を集めているのは、「CeVIO AI梵そよぎトーク」が購入できる3万5000円のセットです。 梶さんは音声生成AIの学習に利用されて、YouTube上で「本人の声で歌ってみた」として、いわゆる“AIカバー”を公開される被害にも合っている立場です。クラウドファンディングの開始にあたり、梶さんは「製品化に関して、正直、たくさん悩んだ」とするコメントも公開しました。「いまだに“声の権利”に関する法整備が手付かずな現状を鑑みると、今後どのような弊害が生じ得るのか、想像がつかない部分が大きかったからです」(コメントより) しかし、梶さんは「人間とAIとの共存」という立場を明確にします。 「結果、“人間とAIとの共存”を本気で考えるなら──(略)その実現に向けての可能性を自ら狭めるようなことをしてはいけないのではないか、と思うようになりました。(略)リスクを背負ってでも、行動に起こす必要と価値があるのではないか、というか考えに至ったのです」(同) パブリシティ権によって「音声」の保護につながる? 5月28日に内閣府が取りまとめた「AI時代の知的財産権検討会・中間とりまとめ」が政府決定として発表されました。それについて、漫画家でもある赤松健参議院議員が、「声優の『声』を保護できないか」という点についてXでコメントしました。 本日(2024/5/28)、政府から正式に「AI時代の知的財産権検討会・中間とりまとめ」が発表されました。AIと著作権を含む、知財権全般とAIに関する考え方について、よくまとめられています。https://t.co/CAW31eAhqg ― 赤松 健 ⋈(参議院議員・全国比例) (@KenAkamatsu) May 28, 2024 「声」の保護については、パブリシティ権による保護が考えられます。 パブリシティ権とは、芸能人など、ある人の名前や肖像などが「顧客を惹きつけて商売できる価値がある」場合、そういった価値を排他的に利用する権利をいい、判例で認められています。そして、名前や肖像のほか「声」についても、パブリシティ権が及ぶ場合があると考えられています。(ただし、前述した「作風」や「労力」は、当然パブリシティ権が及びません。) また、人の社会的評価を下げるような態様で他人の外見や声を使って「無断でディープフェイクを拡散するような行為」は、名誉毀損罪にもなりえます。 法律による保護が難しい場合でも、契約や技術を活用して解決を図り、クリエイターの創作意欲が削がれないようにしていくことが大切だと述べられています。クリエイター側も、時には自分から「契約や技術を活用した方策」で対抗することを模索すべきです。(黙っていても守られないので) (赤松議員の投稿より) 梶さんの戦略は、今後、生成AIによる音声が広がることが確実な未来で、法的にも有利な環境を整え、契約や技術を活用することの1つの適切な戦略とも言えます。“公式”のAI音声を出すことによって、それ以外の梶裕貴さんの名前を冠した生成AIはすべて非公式のものであると区分できることで、法的な対処もしやすくなります。ユーザーにしても、高い品質の公式製品がリリースされると、非公式な製品を利用する価値は相対的に小さくなります。このプロジェクトの成功は、結果的に声優にとって、生成AI時代に新しい収益を獲得する選択肢を広げられる可能性があります。 7万点以上の「生成音声」が公開されるサイトも ただし今後、生成AIによる音声はどんどんと増えていくことになるでしょう。 例えば、音声データさえ用意すれば、自動的に生成AI音声を作り出す「Voice-models」というサービスが登場しています。クオリティーには限界があるものの、作成されて公開されている音声だけで7万点を超えています。ただし、経済的な被害といえるほどの影響が出ているのかははっきりしません。 声と生成AIについての分野は、新しい分野であるため、世界的に見ても、まだまだ法的な議論はこれからという形で、どのように社会的な汎用ルールに落ち着いていくのかはまだはっきりしません。もちろん犯罪に利用することは現在でも許されるものではありませんが、どこまで技術の発展が進むのかには注視が必要でしょう。 筆者紹介:新清士(しんきよし) 1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。 文● 新清士 編集●ASCII