Googleの最新AI動画生成ツール「Veo 2」:何ができるか&試し方教えます
AI動画生成の進化の勢いは、とどまるところを知らないようです。 Googleは2024年5月、動画生成ツール「Veo」を発表。OpenAIは12月に「Sora AI」を一般公開しました。 そして先日、Veoに大幅なアップグレードが施された「Veo 2」が発表されました。 GoogleはVeo 2について、ユーザーの選択肢という点と、プロンプトを忠実に守れるという点で、Soraをはじめとする他社製ツールを上回っていると述べています。 それらを示すチャートは、Veo 2の公式サイトで確認可能です。 また、この新モデルの登場にともない、動きの処理の向上やカメラ調整の改良のほかに、「リアリズムと、映像の忠実度も強化された」とも述べています。
Veo 2で出来ること
Googleは、Veo 2の高度な動画生成機能の背景には「現実世界の物理学に対する理解と、人間の動作・表情の微妙な違いに対する理解の向上」があると述べています。 ということは、Veo 2で作成した動画は、ほかと比べると、おかしなところが少なくなるはずです。 さらにVeo 2は、映画関係の専門用語の処理能力も向上しています。 つまり、映画のジャンルやレンズのタイプ、映画特有の映像効果といった具体的な指示をプロンプトに含めても、それに対応できるということです。 「ローアングルのトラッキングショット」や「クローズアップショット」「浅めの被写界深度」といった用語にも対応できるVeo 2なら、プロンプトにもっと近い動画を生成できそうです。 Veo 2の最高解像度は4Kで(1080pからアップグレードされました)、最長数分間の動画を作成できます。 Googleが公開しているサンプル動画のなかには、目を引くものもあります。 たとえば、容器に注がれている飲みものや、プールで浮き袋に乗る犬、カメラに語りかけるアニメのキャラ、顕微鏡をのぞき込む科学者などは、かなりの出来ばえです。 とはいえ、Veo 2も完璧ではありません。 複雑なシーンに一貫性を持たせるという課題は、いまも完全には実現されていません。その点はGoogleも認めています。 これはVeo 2だけにかぎった話ではありません。 どのAI動画生成ツールも、莫大な量のトレーニングデータをもとに、現実世界の物理学や空間をおおよそ把握することはできても、正確には理解できないのです。 見ればわかりますが、これらの動画のなかに、画面からフェードアウトしてから戻ってきた様子を捉えているものは1つもありません。 おそらく、AIがやると、それを忘れてしまうか、違うやり方でレンダリングするからでしょう。