OpenAIの動画生成AI「Sora」が一般公開の衝撃。3つの「特殊な動画生成」機能を探る
OpenAIは12月9日(現地時間)、動画生成AI「Sora」を正式に公開した。 Soraは2024年2月にOpenAIが発表し、これまでOpenAI社内や同社から技術提供を受けたクリエイターのみが利用できる状態だった。 【全画像をみる】OpenAIの動画生成AI「Sora」が一般公開の衝撃。3つの「特殊な動画生成」機能を探る すでにChatGPT の有料プランの「Plus」(月額20ドル)と、5日に発表された「Pro」(月額200ドル)のユーザーはSoraが利用できる。また 、Soraの強化版にあたる「Sora Turbo」も同時に公開された。
テキストから生成する以外にもある特殊な動画制作AI機能
Soraは動画生成AIということで、いわゆる「Text to Video」(テキストから動画生成する)機能が2月から強調されてきた。 Sora自体は最大1080pの解像度で、最大20秒の長さ、縦横比が横長、縦長、正方形いずれかの動画を生成できる。 ただし、契約しているプランによって使える機能や制限が異なる。 例えばPlusでは最大720p解像度・最大5秒間の動画を生成できるが、Proでは最大1080p・最大20秒間になる。生成できる動画の本数(生成クレジット)もProはPlusの10倍で、生成した動画のウォーターマーク(透かし)の有無を選べるのもProユーザーだけだ。 Soraは単なるテキストから生成する動画AIではなく、動画制作に便利な複数の機能も持っている。 例えば、既存の動画の前後を生成して、カットの長さを調整したり、永遠に続いているように見えるループ動画を生成することも可能。 また、「ストーリーボード」「ブレンド」「スタイルプリセット」という3つの特殊な制作機能も持つ。
動画生成AI「Sora」、3つの制作機能
1つ目のストーリーボードは、アイデアなどの短い文章から脚本を生成する機能だ。 動画自体を生成するのではなく、あくまでも「テキストからテキストを生成」する機能であり、同じことはChatGPTなどに「以下のイメージに合う映像の脚本を書いて」などとプロンプトを打てばできる。 ストーリーボードは動画を生成する前段階で、画面遷移することなくSoraの画面上で実行でき、チャプターごとに微調整が加えられる点が、チャット型生成AIを使う場合と異なる。 2つ目のブレンドは「動画から動画を生み出す」機能だ。 異なる2つの動画を読み込ませて、AIがそれらの動画の要素を読み込んで新しい動画を生成する。 読み込む動画はAIが生成したものでも、ユーザーが別に制作したものでもいい。 ミックスする動画の重みづけ(バランス)はユーザーが任意に指定できる。現状、出力される動画は入力した動画より短くなるという制約がある。 3つ目のスタイルプリセットは、動画に対し「効果」を指定して動画の雰囲気を変換する機能。 Soraの製品ページでは、Soraで生成したマンモスとサイが雪原を歩く動画に対し「段ボールとペーパークラフト」「アーカイブ」「フィルムノワール」という3つの効果を適用した結果が披露されている。 なお、OpenAIの広報担当者によると「Sora」とは日本語の「空」から来ており、無限に広がる空と同じく「無限の可能性を想起させるツール」という意味が込められているという。
小林 優多郎