【速攻解説】OpenAI「Sora」の使い方 月額3000円で出来ること、出来ないこと
OpenAIは現地時間12月9日、動画生成AI「Sora」の一般提供を開始。さっそく使用感をレポートする。 【もっと写真を見る】
OpenAIは現地時間12月9日、動画生成AI「Sora」の一般提供を開始した。「ChatGPT Plus」(月額20ドル、約3000円)でも、720p解像度で5秒間の動画を月50本まで生成できるとのことなので、さっそく試していくことにしよう。 アカウントを作成する まずは「https://openai.com/sora/」にアクセスし、画面を一番下までスクロールすると出てくる「Start Now」ボタンをクリック。 現在アクセス集中のためなかなか入ることができない。この画面が出たらアクセス失敗。 生年月日の入力欄が出たらチャンスだ。入力して「Next」をクリック。 すると料金表が表示された。筆者が現在加入中の「ChatGPT Plus」(月額20ドル、約3000円)でも利用は可能だが、「ChatGPT Pro」(月額200ドル、約30000円)にアップグレードするとさらに生成できる動画の本数が増えるらしい。ひとまず「Continue」をクリック。 ユーザーネームを入力して「Next」をクリック。 無事「Sora」の画面が表示された。 ユーザーインターフェースを確認 最初に、画面下部に表示されている動画を生成する際に使用するユーザーインターフェースを見ていこう。 「Upload Image」を押すと、後述するi2v(画像動画)で使用する画像をアップロードすることができる。 「Preset(プリセット)」をクリックすると、「Baloon World」や「Stop Motion」といった特定のビジュアルスタイルやエフェクトを動画に適用できる。 Preset画面右上の「Manage(管理)」をクリックすることで、設定されたPresetの内容を確認したり、改良・新規作成することが可能になっている。 「Aspect Ratio(アスペクト比)」はデフォルトの「16:9」の他に、Instagramなどで便利な「1:1」と、TikTokなどで便利な「9:16」が用意されている。 「Resolution(解像度)」は、ChatGPT Plusの場合、デフォルトの「480p(アスペクト比が16:9の場合、854×480 ピクセル)」の他に「720p(同1280×720ピクセル)」を、ChatGPT Proに加入すると「1080p(同1920×1080ピクセル)」を選択できる。 「Duration(動画の長さ)」は、デフォルトの「5秒」の他に「10秒」を、さらにChatGPT Proに加入すると「15秒」「20秒」を選択可能。 「Variation」では同時に生成する動画の本数を指定する。デフォルトは「2v(2本)」だが、「1v」にしておけば生成時間を短縮できる。また、ChatGPT Proに加入すると「4本」同時生成できる。 いつものお姉さんを生成 それでは実際に動画を生成してみよう。いつものプロンプトを少し改良したものを入力し、「↑」ボタンをクリック。 プロンプト:A photorealistic portrait of a young woman with dyed pastel pink hair and subtle makeup, wearing trendy streetwear. She is captured mid-step as she confidently strides across a bustling urban crossing, her hair gently swaying with her movement. Neon signs in the background cast colorful reflections on the wet pavement, adding a vibrant atmosphere to the scene. The cityscape is alive with blurred motion from cars and pedestrians in the distance, enhancing the dynamic energy of the setting(訳:パステルピンクに染めた髪にさりげないメイクを施し、流行のストリートウェアを身にまとった若い女性のフォトリアリスティックなポートレート。賑やかな都会の横断歩道を自信たっぷりに闊歩し、髪をゆるやかに揺らしながら歩く彼女の姿が捉えられている。背景のネオンサインが濡れた舗道にカラフルに反射し、シーンに活気を与えている。街の風景は、遠くの車や歩行者のぼやけた動きで生き生きとしており、舞台のダイナミックなエネルギーを高めている。) ちなみにこのプロンプトはChatGPTに考えてもらった。 タイミングによってはこのメッセージが出て生成できないこともあるが、何度か繰り返せばだいじょうぶなことが多い。 サムもがんばってるみたいなので応援しよう。 この画面が表示されればキュー(順番待ち)に入ったということだ。かなり時間がかかるのでのんびり待とう。 無事、2枚の動画が生成された。ちなみに生成時間は約4分。 うおおおおお~~~!!動いとる!!!! 個別画面のメニュー 生成された動画のサムネイルをクリックすると、個別の編集画面が表示される。 画面の右上には動画をシェア・保存するためのアイコンが表示されている。 「♡」はお気に入りの作品をチェックする「Favorite」ボタン サイドバーの「Favorits」を選ぶことで、お気に入りの動画のみを表示できる。 これはシェアのためのアイコン。クリックして「Copy Link」を選ぶと動画のURLをコピーしてSNSなどにシェアできる。また、「Unpublish」を選ぶと、動画は非公開になる。 「Download」をクリックするとMP4形式で動画を保存できる。 次に個別画面の下にあるメニュー群を見ていこう。ここでは作成した動画を様々な方法で編集・改良できる。 「Edit Prompt」ボタンをクリックすると、生成の際に利用したプロンプトが再び表示され、自由に編集できるようになる。 「View Story」ボタンをクリックすると「Story Board(ストーリーボード)」画面に遷移する。この機能に関しては後で詳しく説明する。 「Re-cut」ボタンをクリックすると、動画内の最適なフレームを見つけて抽出し、そのフレームを基準に、前後に動画を延長できる「Re-cut機能」を使用できる。 「Remix」ボタンをクリックすると、空のプロンプトウィンドウが表示される。 プロンプトを入力することで、元動画の要素を変更・編集(Remix)できる。ここでは髪の色を黒に変えてみよう。 プロンプト:Turn hair color to black 髪色はバッチリ変わったが、顔もまあまあ変わってしまった。 「Blend」は、文字通り2つの動画を1本の動画に合成する機能らしい。 「Loop」ボタンをクリックすると、動画がエンドレスにループするよう加工してくれる。 スタートポイントとエンドポイントも指定できる。 ループスタイルは3種類。 これがループ加工後の動画だ。多少途中で不自然なところがあるような気もするが、これも調整次第だろう。 Loop pic.twitter.com/cIrse5emK6 ― kazuhiro taguchi (@tagkaz) December 10, 2024 写真が動き出すニャン Soraは、テキスト(text)から動画(movie)を生成する「t2v」だけではなく、画像(image)から動画を生成する「i2v」にも対応している。さっそくプロンプトウィンドウの下にある「+」ボタンをクリックして試してみよう。 初回クリック時には、以下の4つの同意項目が表示される。 ・18歳未満の人物や同意のない人物の映像をアップロードしないこと ・暴力的または露骨な内容を含むメディアをアップロードしないこと ・アップロードするメディアに関して必要な権利を所有していること ・メディアの不正使用はアカウントの停止やBANにつながる可能性があり、その場合の返金はないこと すべてにチェックを入れて「Accept」をクリック。 今度は「Media containing people(人物を含むメディア)」に関する警告・通知画面だ。「現在のアカウントでは人物を含む動画の作成はサポートされていない。人物を含む写真や動画をアップロードした場合、動画の生成は失敗するがクレジットは消費されない」とある。 試しに人物写真を入れて生成してみると。 このようにエラーが出て生成を拒否された。 それでは気を取り直して猫の写真を元に生成。プロンプトはChatGPTと相談して下記でやってみた。 プロンプト:a cat softly meowing with half-closed eyes. The cat stretches slightly and then curls its tail, showing its relaxed and drowsy mood(半目を閉じて、そっとニャーと鳴く猫。猫は少し伸びをしてから尻尾を丸め、リラックスして眠そうにしている。) 期待通り、静止画が動き出してくれた。毛並みなどめちゃくちゃリアルでちょっとびっくりするレベル。 さらにこちらは勝手にカメラの動きも加えてくれている。細かく指定することでさらに詰めていくこともできそうだ。 失敗例もお見せしよう。こちらも同じ猫の写真を元に生成したのだが。 プロンプト:A heartwarming animation of a fluffy tabby cat lounging lazily on a brick patio. The cat stretches its front paws forward, yawns cutely with its eyes half-closed, and then playfully bats at a small twig nearby. The warm evening light creates a cozy and serene atmosphere, with tiny patches of grass peeking through the bricks, adding to the charm.(レンガ造りの中庭でのんびりとくつろぐふわふわのタビー猫のほのぼのとしたアニメーション。猫は前足を前に伸ばし、目を半分閉じてかわいらしくあくびをした後、近くの小枝を叩いて遊んでいる。暖かな夕暮れの光が居心地の良い落ち着いた雰囲気を醸し出し、レンガの隙間から覗く小さな草が趣を添えている。) このようにいきなり別の猫に変身してしまった。i2vの場合はプロンプトが詳しすぎてもダメなのかもしれない。 Storyboardを試す 最後に、複数の動画を時系列で編集できる「Storyboard」機能を見ていこう。 Storyboard画面では、画面上部に素材、下部にタイムラインと各種設定アイコンが配置されている。 タイムライン上にプロンプト、もしくは既存の画像または動画を配置できる。ただし、この設定だと人物が含まれているので生成を拒否されてしまった。 仕方がないのですべてのシーンをプロンプトで記述。 生成された動画。俯いていたお姉さんが途中でまばたきを始めるのがわかるだろうか。ストーリー性のある動画をプロンプトだけで生成できてしまうのは驚きだ。 プランが悩ましい 以上、一通りSoraの機能を試してみたが、残念ながらChatGPT Plusでは月に50枚しか作成できない。週ではない、月だ。 最も気になるのはChatGPT Proに契約すると人物を使ったi2vが可能かどうかだ。筆者が調べた限りではまだ確認できていないが、もし可能ならChatGPT Proへのアップグレードもありなんじゃないか、、と思い始めている。 田口和裕(たぐちかずひろ) 1969年生まれ。ウェブサイト制作会社から2003年に独立。雑誌、書籍、ウェブサイト等を中心に、ソーシャルメディア、クラウドサービス、スマートフォンなどのコンシューマー向け記事や、企業向けアプリケーションの導入事例といったエンタープライズ系記事など、IT全般を対象に幅広く執筆。2019年にはタイのチェンマイに本格移住。 新刊発売中:「生成AI推し技大全 ChatGPT+主要AI 活用アイデア100選」: 文● 田口和裕