OpenAIの動画生成AI。描写力は圧巻だが…“問題”が多そうだ
OpenAIが開発を進める、一般公開前の映像生成AIツール「Sora」が、一部のアーティストによってリークされました。 Soraはテキストから映像を生成できるAIツールで、一部のテスターにのみ無償で早期アクセスが提供されていました。しかし、リークを行なったグループはこれを、OpenAIによるアーティストからの搾取であると批判。さらに彼らは、OpenAIがSoraの性能について歪曲的であることも指摘し、テスターは生成された作品を自由に公開できず、すべてOpenAIの事前承認が必要とされていたと主張しています。 抗議として彼らは、Hugging Face上でSoraによって映像を生成できるツールを公開。しかしその後アクセスは停止されました。このツールでは、プロンプトを入力することにより、10秒間の1080pの映像を作ることができたようです。 一方OpenAIによると、Soraはまだ研究プレビュー段階であり、クリエイティビティと安全性のバランスを取るための取り組みを続けていると説明。テストの参加は任意であり、フィードバックの提供などは強制しておらず、今後も助成金や支援プログラムによってアーティストをサポートしていくと述べています。 AIの開発と、それに携わる人たちの権利。昨今注目されるトピックですが、公開前のサービスがリークされて、使えるようになってしまったのは多くのオーディエンスに衝撃を与えました。一部のユーザーは実際にこのツールを使えたようで、Xにツールを使って生成された動画が掲載されました。そのいくつかを見てみましょう。
クオリティ高いけど、細部には違和感あり
まず、2匹の犬が室内で戯れている様子。パッとみた感じ、クオリティの高さ、すごいですね。犬の毛並みの感じとか、背景のリビングの雰囲気までリアルに再現されています。犬の動きも、本物っぽいですよね。ただ、途中2匹が一緒にぐるっと回転するところで、一瞬2匹が混ざったように見える部分があり、まだ発展途上であることが伺えます。 次にサルの動画。パズルをいじる仕草や、光を受けた毛並みなど、これまたリアルです。ただ、正確に把握できませんが、尻尾が3本あるように見受けられます。正しく生成が行なわれていないようです。 次はこちら、水の中の赤ちゃんの動画。非現実的なシーンですが、光や水に映る赤ちゃんの姿といったディテールの再現度が高く、本物の映像に見えます。こうした現実ではありえないシーンを本物っぽく、簡単に作れてしまうのだから、生成AIツールはパワフルです。 一方、麺類を食べる男性の映像は、違和感だらけでした。フォークが途中で曲がるように見えますし、何より食べ方がおかしいです。理解ではなく、データによって映像を生成している、AIが作った映像ということがわかってしまいます。 カートゥーン風の映像も作られています。よく見てみると、衣服のデザインがめちゃくちゃです。人間が作るなら、こうはおそらくなりませんよね。 鳥の映像は、鳥特有の素早い動きが見事に再現されていました。 最後に人の映像の生成です。見た目はとてもリアルですが、手の動きが不自然。缶に対して変な触り方をしています。おしい、というところです。 全体的に、驚くような仕上がりでかなり期待できそうです。ただ、完璧というわけではなく、まだ細部に関しては、ところどころ違和感が見受けられます。おそらく、欲しい映像を手に入れるには、何回かプロンプトを入力する作業が必要そうです。 AIの発達にしても、それをリークできてしまう環境にしても、すごい時代になってきました。 Source: Gizmodo US / TechCrunch
小野寺しんいち