Yahoo!ニュース

AIが画像生成「Stable Diffusion」 実際に使うには注意点も

山口健太ITジャーナリスト
Stable Diffusionのデモ機能(Webサイトより、筆者撮影)

AIによる画像生成サービスが次々と公開され、話題になっています。見たこともないような画像を簡単に作れることに衝撃を受ける一方で、実際に活用するには注意点もありそうです。

指示に基づいてAIが画像を生成

8月22日、ロンドンで創業したスタートアップ企業のStability AIが、画像生成AI「Stable Diffusion」を公開しました。

ローカル環境で動かせるオープンソースのツールのほかに、Webブラウザーで試すことができる仕組みも用意されています。

また、Webアプリ版の「DreamStudio Lite」は有料のサービスですが、無料のアカウント登録でもらえる2ポンド分のクレジットでも十分に実力を確かめることができます。

こうしたツールで画像を生成するには、プロンプトと呼ばれる指示を入力します。現在は英語のみですが、名詞や形容詞はもちろん、背景や描画のスタイル、具体的な画家の名前なども指定できるようです。

プロンプト(指示)に基づいて、AIが画像を生成してくれる(Webサイトより、筆者作成)
プロンプト(指示)に基づいて、AIが画像を生成してくれる(Webサイトより、筆者作成)

実際にStable Diffusionのデモを使って、「アップルストアの明るい木のテーブルの上に並ぶ来月発表予定の新型iPhone」という指示を出してみました。

Stable Diffusionが生成した新型iPhone(Webサイトより、筆者作成)
Stable Diffusionが生成した新型iPhone(Webサイトより、筆者作成)

5分ほどかけて生成された画像では、背面カメラの数が異なる2つのモデルが描かれています。アップルストアの雰囲気も妙にリアルです。

DreamStudio Liteでは、5〜10秒で高速生成する設定も用意されています。こちらでは「宇宙空間の星空の中で大きく目を見開き驚いた表情の1匹の茶色い猫」を指示してみました。

DreamStudio Liteで生成した猫(Webサイトより、筆者作成)
DreamStudio Liteで生成した猫(Webサイトより、筆者作成)

このように簡単で強力なツールが登場したことで、社会にどのような影響を与えるのか興味深い議論が始まっています。

たとえば、それほど重要ではないイメージカットなどにAIを使えるようになれば、人間に発注する時間やコストを削減できる可能性があります。

Stable Diffusionで生成した「青く透明な海に浮かんだ白いベッドがあるコテージの中」(Webサイトより、筆者作成)
Stable Diffusionで生成した「青く透明な海に浮かんだ白いベッドがあるコテージの中」(Webサイトより、筆者作成)

ほぼ同じ条件で、「上空から見下ろした」という指示を加えてみた(Webサイトより、筆者作成)
ほぼ同じ条件で、「上空から見下ろした」という指示を加えてみた(Webサイトより、筆者作成)

一方で、AIは誰が使っても同じではなく、どういう指示を出すかで結果は大きく変わります。AIを意のままに操れることが新しい職業として成り立つかもしれません。

まずは実際に試してほしいと言いたいところですが、注意点もあります。SNSではAIが生成したとされる画像がたくさんシェアされていますが、その多くは「成功事例」です。

AIは必ずしも見栄えのいい画像だけを出してくれるわけではありません。特に、人間や動物を描くように指示した場合、成功するまでにはかなり気持ちの悪い画像が出続ける場合があります。

また、特定の単語は受け付けなかったり、生成された画像にぼかしをかけるなどの対策はしているようですが、いろいろな意味で「不適切」な画像が出てくる可能性もありそうです。

画像の権利は誰のもの?

AIが生成した画像の権利はどうなっているのでしょうか。DreamStudioでは、画像の権利はパブリックドメイン(CC0 1.0 Universal Public Domain Dedication)であると説明しています。

簡単に言えば、画像は誰のものでもなく、自由に使えるという意味になります。一見すると良さそうに見えますが、画像の「出所」が分からないという点には注意が必要です。

パブリックドメインの画像の例としては、著作権の切れた絵画があります。作者や亡くなった年が広く知られている有名な絵画なら、パブリックドメインであることは明らかといえます。

しかしAIが作った画像自体には著作権がないからといって、本当にパブリックドメインであるといえるのでしょうか。

Stable Diffusionでは作例として有名なキャラクターによく似た画像を生成している(Webサイトより)
Stable Diffusionでは作例として有名なキャラクターによく似た画像を生成している(Webサイトより)

AIを作るための学習データとしては、インターネットから収集した58億の画像とテキストのペアを含む「LAION-5B」を用いたと説明しています。

こうしたデータを研究目的だけでなく、収益を得る目的で使うのであれば、元になったデータの作者に何らかの還元をすべきではないか、という議論もあります。

今後の展開によっては、AIが生成した画像を自由に使えるように整備が進む可能性もありますが、現状ではなかなか使いどころが難しい印象があります。

ITジャーナリスト

(やまぐち けんた)1979年生まれ。10年間のプログラマー経験を経て、フリーランスのITジャーナリストとして2012年に独立。主な執筆媒体は日経クロステック(xTECH)、ASCII.jpなど。取材を兼ねて欧州方面によく出かけます。

山口健太の最近の記事