独自の動画生成AI「Vidu」で米Soraに挑む、中国・清華大学系ベンチャーに注目
中国の新興AI企業「生数科技(Shengshu-AI)」がこのほど、清華大学と共同開発したトランスフォーマー「U-ViT(Universal Vision Transformer)」を採用した動画生成AI「Vidu」を発表した。U-ViTは、米OpenAIの動画生成AI「Sora」が採用する「DiT(Diffusion Transformer)」と同様、拡散モデルとトランスフォーマーモデルを組み合わせたトランスフォーマーで、2022年9月にはすでに発表されていた。 もっと画像を見る Viduは、最長16秒・解像度1080Pの高画質動画をワンクリックで生成することができる。Soraの最大60秒には及ばないものの、中国で開発された他の動画生成AIに比べればかなり長い。その動画は滑らかにつながり、細部と論理に一貫性を備えている。プロモーション動画の出来映えはSoraに匹敵する。 生数科技は2023年3月に設立され、画像や3D、動画など複数種類のデータを同時に扱えるマルチモーダル大規模言語モデル(LLM)の開発に注力している。中心メンバーには、 中国で最も早く深層生成モデルの研究を開始した清華大学人工知能研究院の出身者がそろう。同社は24年3月、啓明創投(Qiming Venture Partners)などから数億元(数十億円超)を調達したばかりだ。 (36Kr Japan編集部)