AIイラスト、こうしてゲームに使っています
小社は「生成AIを使っている」ことを公言しているインディーゲーム会社。主にキャラクターデザインなどのアイデア出しにAIイラストを使っています。 【もっと写真を見る】
筆者はインディーズゲーム開発スタジオAI Frog Interactiveの代表をしています。9月26日から29日にかけて開催された「東京ゲームショウ2024」のインディーゲームブースに出展したとき、AIを使ったゲーム開発について複数のテレビメディアの取材を受けました。そこではキャラクターデザインのアイデア出しなどで、画像生成AIの強みが発揮できるという話をしています。 発注指示書レベルのアートワークならAIで作れる 今年のゲームショウでも、テレビメディアが注目したのは生成AIを含むAIのトピックでした。日本のゲーム業界でも、生成AIの導入は進んでいるという実感はあるのですが、生成AIを使っていること自体がゲームを面白くするわけではないので、売りになる要素とはいえません。そのため、生成AIを開発過程で使っていること自体を押し出している企業はほとんどいないという印象です。そんななか、小社は「AIを使っている」ことを公言しているインディーゲーム会社ということもあり、取材がしやすかったのではないかと思います。 小社の社名には「AI」が含まれていますが、これは生成AIだけを示しているのではなく、多数のAIツール機能を搭載しているようなゲームエンジン「Unreal Engine 5(UE5)」等も含め、ゲーム開発を効率化し、ゲームそのものの面白さを追求できるようにAI技術全般を積極的に利用していこうという意味を含めています。ただ、現在のゲーム開発の中で、AIが指し示す範囲は、敵の制御から、地形生成、物理演算など、非常に多岐にわたり、一般的にわかりにくい要素も多数含まれています。そのため、取材の求めは生成AIを使っている部分に集中している印象はあります。 実際、筆者が開発しているゲーム「Exelio -エグゼリオ-」は、フル3Dのサバイバル系クラフトゲームであり、ゲームの実行中に生成AIを使っている部分はほとんどありません。生成AIで作った3Dデータも使っていません。生成AIで作り出される3Dデータは精度が低く、まだゲーム中に直接導入できる品質には達していないと判断しているためです。あくまで開発過程に組み込んで使えると判断したものを選定して使っています。 ▲東京ゲームショウに合わせて公開した「Exelio -エグゼリオ-」のディザームービー。Steam Store 小社は2023年1月に創業していますが、開発を始めた早い段階から、画像生成AIは2Dデザインの一部に使えると判断していました。最終的な3Dモデルは人間が3Dツールを使って作成しなければなりませんが、3Dモデル作成者が参考資料とする発注指示書レベルのアートワーク水準であれば作れると判断していました。 AIでアイデア出し権利確認指示書作成3D化 その1つが、ゲーム中で重要な役割を担うカエルのキャラクターです。経産省が7月に公表した「コンテンツ制作のための生成AI利活用ガイドブック」にも事例として掲載されました。 このカエルのアートワークを筆者が作成したのは、2023年5月頃です。当時、ディレクターから出された最初のオーダーは「かわいいカエルでSFっぽい要素を持っているもの」というものという非常に漠然としたものでした。「こういうものを作ってほしい」という明確なイメージがないんですよね。とにかく、メカっぽくてカエルっぽい、それでいてかわいらしい女の子的な要素を持っているものを作ってくれと。こっちとしては「なんやそれ」というわけです。 そこでどうしたかというと、当時の最新だったクラウド系画像生成AIの「Midjourney v5」でパターンをたくさん出すことにしました。イラストタッチのかわいいものから、セクシーなお姉さん系、メカメカしいデザインなど、とにかく色々なアイデアを数十枚出しました。それをディレクターに提示することで、ディレクターのイメージがだんだんとかたまっていったんですね。ゲームの中にどのような登場の仕方をするのかといった設定にも広がっていきました。そこで「こういう系統のデザインだ」というものが見えてきたところで、そのデザインを中心に再度生成をしました。 これが従来のデザイン方法と違うところです。通常、こんなにも漠然としたオーダーからでは、ふわっとしたものしか出てこず、なかなか思ったイメージにたどり着きにくく、時間もかかります。しかし、アイデア出しの段階で大量のバリエーションを出せるのが生成AIの強みです。生成AIを介在させることで、ディレクターのイメージを発展させ、より望ましい姿を形作ることを、効率よく効果的に実現できたと考えています。 そうして、最終的なデザインがまとまったら、著作権侵害のリスクをチェックするために、Google レンズなどの画像検索にかけて類似性に問題ないかを確認しています。そして、人間がデザインに手を入れて完成させています。 3Dに起こすための補足説明などを文章で説明したりしつつ、発注指示書を作っていきます。3Dモデルの資料としては必須の「裏側」の情報がないので作成する必要があります。 当時は、まだ三面図を作成する手法が、現在ほど整っていなかったので、表側の画像をもとに、生成AIを利用しつつ人間が想像しつつ裏面を作り上げていきました。生成AIを使って作成しつつも、フィニッシュ作業はやっぱり人間がすることで最終的なクオリティーを担保するという方法論で進めました。 「Exelio -エグゼリオ-」に登場するキャラクターは同じような方法で2Dデザインをして3Dモデル化していますが、画像生成AIは登場から約2年間、日進月歩で技術進歩が進んでいることもあり、使用する技術はその時々で目的に合わせて選定しています。そのため、カエルの方法論をすべてのキャラクターに使っているわけではありません。実際、その後も様々な技術が登場していることもあり、使えそうな技術はどんどんと実験して組み入れています。 AIで「三面図」を出し、衣装のバリエーションを作る 東京ゲームショウ時の取材で見せたのは、その新しく試していた手法です。ゲームのヒロイン向けに追加の衣装を作ろうという話が出ており、新たにデザインを起こす必要が生まれました。ちょうど8月に登場した画像生成AI「FLUX.1」の性能が高く、デザイン的に一貫性を保ったままいきなり三面図を作成できることがわかったので試し始めたのです。 ディレクターからは「チャイナドレス風衣装は作れないか。物理オブジェクトがついている、ヒラヒラしているような」というオーダーがあったんです。またしても「なんやそれ」という感じだったんですが(笑)。 まず、Midjourneyのアニメ系画像生成AIサービスの「Nijijourney」を使い、ヒラヒラしたチャイナドレス風衣装を着たキャラクターのバリエーションを大量に作りました。バリエーションを作る「Vary」の機能を使うことで、一度出た画像のバリエーションを出すことは簡単で、また生成にかかる時間もカエルの頃よりも格段に早くなっています。 次に、出てきた画像を選別し、30枚のセットにしてFLUX向けのLoRAを開発しました。LoRA作成ツールは「FluxGym」を使います。ポイントは三面図を出力することが目標であるため、そのなかに後ろ姿の画像も含めておくという点です。それにより、背面の出力も適切にできる可能性を高めることができます。 そして、ヒロインキャラクターの3Dモデルのスクリーンショットを用意し、Flux.1が動作するWebUI Forgeの環境で、LoRAと組み合わせてImage-to-Image(i2i)で生成します。これによって、様々な服装をした女性の三面図のバリエーションが、30秒に1枚くらいのペースで出せるようになりました。ControlNetを使ったほうが望ましい一貫性を作成できる可能性があるのですが、まだForgeではその環境が登場していないために、i2iで作成しています。 生成される画像は完璧ではなく、前後を取り違えたり、デザインが破綻していたりと完全な一貫性を担保できていないものも少なくないのですが、まずは十分です。 ここで出された三面図のなかから、どんなコンセプトを狙っていくのかという絞り込みを進めています。カエルの時よりも、精度が高い画像をより速く出せるようになっています。参考にできる画像が出てくると、ディレクターのイメージも膨らむもので、「若干SF的な意匠を盛り込んでほしい」などの追加注文が出てきます。それらを他の自作LoRAなどと組み合わせたり、レタッチ作業をして情報を整理しながら、精度を上げていきます。そして、まだ最終的な完成には至っていないのですが、最後は人間の手でデザインをまとめ上げていくことになります。 AIの強みはアイデア出し 技術の見極めが難しくなる やっぱり「ディレクターが考えている世界にいかに近づけるか」ということを考えると、生成AIの強みは、アイデア段階に強いという印象を持っています。ただ、この辺も、さらに今後の発展で変わっていくと考えられます。 ちなみに、画像生成AIは絵的にわかりやすいので、話題になりやすいのですが、ChatGPTなどのLLMも積極的に使っています。 特に使っているのがプログラミング作業で、UE5のC++のコードを書くために独自のプロンプト設定を作り、積極的に使っています。ChatGPTも初期は学習範囲に制限があったので、最新のUE5の情報を調べると間違えることが多かったのですが、バージョンアップがされるたびに学習範囲が追いついてきたのか、最近はかなりの情報に的確な返答をしてくれるようになりました。ただし、それでもハルシネーションが消えているわけではなく、正しい回答は5回に1回ぐらいで、生成されたコードがそのまま動くことも少ないということを頭に入れたうえで使う必要があります。 LLMは設定資料づくりでも使っています。LLMにはハルシネーションはつきものですが、フィクションを扱うゲームの場合には、むしろそれで独自の科学設定などを出してくれる方が都合の良い面があります。いくつも考えさせ、面白い設定などを提案してきた場合のみ採用するというやり方を取っています。 一方で、シナリオ生成は、現状まるで使いものになりません。いくつものLLMで試しましたが、そのまま使い物になる水準のシナリオを出力することはまだ難しく、アイデア出しにも使えるか微妙な水準です。今は、人間の代わりにはならないと結論づけています。 筆者のチームはベテランばかりとはいえ、開発スタッフが4人ということでよく驚かれます。確かに生成AIによって効率化が成し遂げられている部分もありはするのですが、実際のところは、生成AI以上にUE5を使える部分の方が、それなりの規模のゲーム開発を実現するには重要な要素だと考えられます。UE5は、売上が100万ドル(約1億4000万円)を超えるまでは無料で使えるというところも大きいです。 今年の東京ゲームショウでもインディーゲームブースが大いに盛り上がっており、目玉のひとつにまでなっていますが、UE5やそのライバルのゲームエンジンであるUnityを通じて間口が広がっていなければ、ここまでのインディーゲームの隆盛は起きていなかっただろうというのが実感です。 一方で、この2年間の生成AIの技術発展を追い続けて感じているのは、使用時の見極めの難しさが上がっていることです。技術発展が速く、派生技術も次々に登場しています。どういう使い方をして、どの技術を選ぶのかを決めるための専門知識の難易度は上がっており、これが平易になることはないのではと感じています。生成AIは今後、ゲーム開発に様々な面で組み込まれていくと考えられますが、まだまだゲーム開発に使える部分は限定的なため、意図を絞って適切に使っていく必要があるように思えています。 筆者紹介:新清士(しんきよし) 1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。 文● 新清士 編集●ASCII