動画分析もAIで自動化する時代に、NVIDIAのAI Blueprintが示す動画分析AIエージェントの可能性
AIを活用した動画分析技術、NVIDIAの最新アプローチ
テキストデータの分析/処理精度は、大規模言語モデル(LLM)の登場により大きく改善した。一方、画像や動画の分析は、複雑な視覚情報の理解が必要となるため、その自動化には依然として課題が残されている。この状況を一変させる可能性を秘めているのが、NVIDIAが発表した「AI Blueprint」だ。 2024年11月に発表されたAI Blueprint(AIブループリント)は、さまざまな業界の開発者が高度な映像分析AIエージェントを簡単に構築できるツール。コンピュータビジョンと生成AI技術を組み合わせたシステムで、膨大な映像データから必要な情報を検索/要約することができる。このシステムの背後では、メタ社のLlama 3.1 405Bなどの大規模言語モデルと、NVIDIAの視覚言語モデル(VLM)などが連携して稼働している。 従来の映像分析システムでは、厳密なコードによる実装が必要だったが、AI Blueprintでは自然言語による指示だけでAIエージェントをカスタマイズできる。また、エッジ、オンプレミス、クラウドのいずれの環境でも利用でき、GPUによる高速処理により、大量の映像アーカイブから重要な瞬間を特定する作業を大幅に効率化することが可能となる。これにより、産業や自治体におけるAIアシスタントの導入障壁が大幅に低下することが期待される。 すでにアクセンチュア、デル、レノボといった大手テクノロジー企業が動き出している。デルは自社のNativeEdgeプラットフォームにAI Bluprintを統合、レノボもHybrid AIソリューションへの統合を進めている。一方、アクセンチュアはAI Blueprintを同社のAI Refineryに統合し、企業データを活用したカスタムAIモデルの開発支援を推進中という。 AI Blueprintは、NVIDIAのMetropolisと呼ばれるビジョンAIアプリケーション開発ツール群の一部として提供される。開発者は無料でAI Blueprintを試用/ダウンロードでき、NVIDIA AI Enterpriseを通じて本番環境での展開も可能だ。