アドビの画像生成AI機能がまた進化 白黒3Dモデルがリアルな都市に
アドビの「Photoshop」や「Lightroom」で使えるAI機能「Adobe Firefly」に大幅なアップデートがありました。「Image 3」という新モデルがプレビュー版として追加されたことで、全体的な品質が上がっています。 【もっと写真を見る】
4月下旬に、アドビの「Photoshop」や「Lightroom」で使えるAI機能「Adobe Firefly」に大幅なアップデートがありました。「Image 3」という新モデルがプレビュー版として追加され、全体的な品質が上がっています。部分的には画像生成AIのコントロールツール「ControlNet」のような様々な設定ができるようになったことで、制御しやすさが増しました。また、存在しない画面外の領域を追加で生成できる「生成拡張」機能が入ったり、企業向けですが、「スタイルキット」を使うことで、一貫性を保ったまま、他の画像を試したりできるようになっています。 「東京の高層ビル」だけで本物と見紛うクオリティー Fireflyはウェブサイトを通じてサービスが提供されています。例えば、「東京の高層ビル」として生成すると、10秒ほどで4枚の2048x2048の画像が生成されます。これは旧モデルの「Image 2」と比較すると、画像が破綻しがちだったところがかなり解消されています。パッと見たら本物と見紛うクオリティーで、写真のような生成結果は、Fireflyならではの強みといった感じです。画像サイズは、横(4:3)、縦(3:4)、正方形(1:1)、ワイドスクリーン(16:9)から選ぶ方式です。プロンプトは、日本語でも入力が可能です。 使い方がわかりやすいのは「構成」という新機能。これは参照先となる画像を入力すると、それに合わせて、画像を生成してくれるものです。画像生成AI「Stable Diffusion」のコントロールツール「ControlNet」のひとつ、線を抽出して画像に反映する機能「Canny」に近い原理で動作していると考えられます。東京の高層ビルの画面構成をコントロールしようとしたら、白黒での画像をアップロードすると、その画像を参照して、東京の高層ビルを生成してくれます。日本のビルっぽい雰囲気を生成するには、国土交通省が公開している3D都市モデル「PLATEAU(プラトー)」の「PLATEAU VIEW 3.0」が使いやすいのでおすすめです。 PLATEAUの画像を利用して、「構成」の参照画像として指定すると、それに合わせ、現実にはないそれっぽい東京の画像を生成してくれます。 天気を変えたり、夜景にしたりすることもできます。ビルの構成を完全に一致させることはできませんが、参照画像に基づいて生成されているので、それなりに一貫性がある画像を生成することができます。同じ画像を使い、ニューヨークやロンドンなど、まったく違う都市、さらにはスチームパンクな都市、城などを生成してもそれなりに反映されます。 しかし、これを人物でやるとあんまり似ません。いつものこの連載でおなじみのAIキャラクター「明日来子さん」の画像をどれくらい再現できるかと構成を試してみたのですが、まったく別の人物が出てきます。構図は維持されていますが、はっきりと別人と思われる女性が生成されます。また、生成ポリシーに引っかかるプロンプトは無視されるようで、「少女」というワードは有効ではなく、「女性」とする必要がありました。これはおそらく意図的なもので、フェイク対策の意味合いが強いのだろうと思えます。アドビは、顔を似せる機能は別に検討しているようですが、現状では同じ顔を生成させることは難しいと言えます。 一貫性を保ったまま他の画像を作成する「スタイル」 「スタイル」も新機能として追加されています。画像の参照するスタイルを指定したり、効果を決めたり、ライトやカメラアングルのしてもできたりと、簡単操作で様々なことができます。ただ、パラメーターにはなかなかクセがあるので、狙った画像を出そうと思うと試行錯誤は必要です。一方で、3DCGなどの背景画像を、リアルな写真風に近づけたものを出力するといったことは得意です。 アドビは、ウェブのFirefly単独ではなく、Photoshopなどの他のアプリと連携して使用することが想定されていると考えられます。例えば、先ほどの熱帯雨林に人物を追加したい場合には、別にFireflyで人物を生成し(上)、Photoshopに読み込み、強力な生成AI機能の一つである「背景を削除」を選択すると、合成画像(中)が簡単にできあがります。被写体を選択して、選択範囲を反転し、「生成塗りつぶし」を使って、ジャングルを生成するという方法(下)もあります。ここまでの作業は数分でできます。現状は照明を後から調整する「IC-Light」(参考記事)のような機能はないので、一定の不自然さは残りますが、十分に使い物になります。 服も着せ替えできる「生成拡張」 さらに面白いのが、「生成拡張」。ウェブ版のFireflyでも、Photoshopでも使用可能ですが、先ほど生成した背景の存在しない領域を違和感なく拡張して、画像を追加生成できてしまいます。さすがに人体を拡張させていくと破綻が出てきますが、元の画像を解析して、適正な画像を作り出してくれます。このあたりは相当便利になったと感じます。 以前Xでバズっていたのが、服の画像を使ったモデルの「着せ替え」です。画像のなかで服を選択して、「生成塗りつぶし」から参照する画像を選びます。これだけでしっくりなじむようになります。 Newest update of Generative Fill in Photoshop pic.twitter.com/u9vyv28plP ― Photoshop Tricks! (@gisellaesthetic) May 26, 2024 生成塗りつぶし機能は、イヤホンのコードのようにいらないものをあとかたもなく消せるという点もよく紹介されます。Lightroomにも色々と、生成AI機能が入ってきていますが、PhotoshopだけだったAI削除がLightroomでも使えるようになったことで、より便利になってきたという感じです。 学習モデルに批判も AI画像で学習している疑い アドビはこうした生成AI機能を使っているのかどうかを区別できるように、「コンテンツ認証情報」の仕組みを追加しています。現在はまだベータ版ですが、Photoshopであれば専用のタブを開くことで、何の生成AIツールを利用して作成されたのかといった履歴を確認することができます。フェイク画像対策では、この認証制度が重要な鍵を握ると考えられており、他社との連携を含めて、今後も拡張が進められていきそうです。 一方で、アドビは今、学習モデルについて批判をされています。アドビの学習モデルは、「オープンライセンス画像や著作権が切れた一般コンテンツのコンテンツライブラリを活用」し、ユーザーにより登録・販売されている「Adobe Stock」の画像データを学習してきたことで、「Fireflyで作成されたものは、すべて安全に商用利用できるように設計」しているとしてきました。それらの安全性がStable Diffusion、Midjourney、Dall-E3といったモデルよりも安全であるというアピールをしてきました。 ところが、Adobe Stockには、Midjouneryなど他の画像生成AIによって作成された画像が多数登録されており、それらも学習に使われているのではないかという疑問が繰り返し出されているのです。2024年4月の米ブルームバーグ紙の報道によると、アドビは全体の約5%が含まれていることを認めたそうです。 Adobe Stockで、Midjouneryのタグがついた画像を見つけるのは簡単です。これは、アドビがAI生成で作られた画像の投稿も認めているためです。現在では全体の14%にも及ぶと言われています。アドビは、生成AIの画像はその旨のタグを追加する必要性があり、それを学習には使っていないと主張しています。しかし、実際には含まれていないものも多数存在すると見られます。そうした画像が的確に省かれたどうかについて、詳しい情報は公表されていません。アドビは最終的には生成AI画像を学習データから除くとはしています。 ただ、アドビが生成AIに今後も力を入れていくことを止めるとは考えにくいです。アドビは、生成AI機能を同社製品のほぼ全てに拡張しようと推し進めています。昨年に、Fireflyエンタープライズ版で作成した画像で訴訟された場合は、全額保証すると発表しており、問題が起きれば、裁判を受けて立つ姿勢は変わっていません。アドビのユーザー数は同社の画像系のサブスクサービスである「Creative Cloud」の利用者は、2022年には2300万人に達しているとも推計されており、世界最大の画像系生成AIプラットフォームを目指していることは間違いありません。 筆者紹介:新清士(しんきよし) 1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。 文● 新清士 編集●ASCII