無料で使えるオープンソースの高精度動画生成AIが続々登場、Runwayなど既存プレイヤーも独自機能の追加で対抗
Lightricksは、高速性を売りとするオープンソース動画生成モデルを投入
人気の写真編集アプリ「Facetune」で知られるイスラエルのLightricksも高度な動画生成AIモデル「LTX Video(LTXV)」をオープンソースで公開したことで注目を集めている。わずか4秒で5秒間の高品質動画を生成できる、処理スピードに強みを持つモデルだ。
LightricksのCEOであるジーブ・ファーブマン氏はVentureBeatの取材で、基盤モデルはコモディティ化し、ビジネスの核心にはなり得ないと指摘。「スタートアップが真剣に競争していくためには、技術をオープンにする必要がある。世界中のトップ大学の研究者がモデルにアクセスし、新たな機能を追加できる環境を整えることが重要だ」と主張する。また、LTXVの展開をメタのLlamaモデルのリリースに例えている。Llamaは急速にAIコミュニティで採用され、ChatGPTが支配する領域でメタの存在感を高めることに貢献した。コミュニティや学術界に採用されることは、企業にとって大きな利益をもたらすとの見解だ。 LTXVは20億のパラメータを持ち、NVIDIAのRTX 4090などの一般的なGPUでも効率的に動作するよう設計されている。上記のMochi 1と比べても、かなり軽量・高速であることがうかがえる。 RTX 4090よりもさらに強力なH100 GPUを使用すると、768×512解像度で121フレーム(5秒間)の動画を4秒で生成可能という。一般向けのハードウェアでもほぼリアルタイムのパフォーマンスを実現し、同種のモデルの中で最速クラスの性能を実現している。技術的には、拡散トランスフォーマーアーキテクチャが採用されており、これによりフレーム間の滑らかな動きと構造的な一貫性が維持されている。 動画生成分野は、こうしたオープンソース戦略を取るスタートアップだけでなく、アドビなどの大手企業も参入を見据えており、Runwayなど既存プレイヤーへのプレッシャーは強くなるばかりだ。
文:細谷元(Livit)