テキストから動画を作れるChatGPT「Sora」を試してみた

12/20(金) 7:41配信

OpenAIの動画生成ツールSora（sora.com）のトップ画面（筆者撮影）

ChatGPTで知られるOpenAIが、新たな一手を打った。12月9日、テキストから高品質な動画を生成できるAIモデル「Sora」の一般提供を開始した。これまで一部のクリエイターに限定して提供していたサービスを、ChatGPTの有料プランユーザー全員に解放する。【写真で見る】簡単なプロンプトを打ち込むと、AIが解釈して動画生成に必要な詳細な文章を作成　画像生成AI「DALL·E」で培った技術を基盤に、OpenAIは動画という新たな領域に踏み出した。最長20秒、1080p解像度の映像生成が可能なSoraは、単なる動画生成の枠を超え、物理世界のシミュレーターとしての可能性も秘めている。

■高品質な映像を手軽に生成　Soraの利用にはChatGPTのサブスクリプションが必要となる。Plusプラン(月額20ドル)では月50本までの優先動画(720p解像度、5秒まで)を、Proプラン(月額200ドル)では月500本までの優先動画(1080p解像度、20秒まで)を生成できる。いずれも追加料金なしでSoraが利用可能だ。　生成できる映像の幅は驚くほど広い。「パラソルを指して空を飛ぶカワウソ」や「身をくねらせて踊るスマートフォン」といった想像的な映像から、街並みや自然風景、人物の動きまでリアルに表現できる。光の反射や物体の動き、質感の表現など、細部まで丁寧に作り込まれている。

　静止画からの動画生成も可能だ。商品の写真から360度回転する映像を作ったり、風景写真に動きや天候の変化を加えたりできる。　注目すべきは、その使いやすさだ。ユーザーは「雪の降る山小屋」といった短い言葉でプロンプト(指示文章)を記述するだけでよい。ChatGPTが自動的にそれを「夕暮れ時、雪に覆われた山々を背景に、温かな明かりの漏れる古風な木造の山小屋。煙突から煙が立ち上り、大きな雪片がゆっくりと降り積もっている」といった詳細な指示に変換する。AIへの適切な指示の書き方に悩む必要はない。

　操作は映像の設計図となる「ストーリーボード」上で行う。例えば商品の紹介動画を作る場合、最初のシーンで全体を見せ、次に特徴的な部分をクローズアップし、最後に使用シーンを見せる、といった具合に映像の流れを組み立てられる。　生成した映像はさまざまな方法で調整できる。長さを変更したり(Re-cut)、雰囲気を変えて別バージョンを作ったり(Remix)、複数の映像のいいところを組み合わせたり(Blend)、SNS投稿用にループ再生できる短い動画を作ったり(Loop)といった編集が可能だ。

1/4ページ

Yahoo!ニュース

テキストから動画を作れるChatGPT「Sora」を試してみた

【関連記事】

アクセスランキング（経済総合）

雑誌アクセスランキング（経済）