電通デジタルとAmazon、“生成AI”動画広告で「効果8倍、費用7割減」の衝撃…Amazon Novaの成功事例を披露
アマゾンのウェブサービス部門である「Amazon Web Services(AWS)」の年次イベント「re:Invent 2024」にて、同社独自の生成AIモデル群である「Amazon Nova」を発表した。 【全画像をみる】電通デジタルとAmazon、“生成AI”動画広告で「効果8倍、費用7割減」の衝撃…Amazon Novaの成功事例を披露 re:InventはAWSのイベントではあるが、発表にはアマゾンのCEOであるアンディ・ジャシー氏が登壇。AWS最大のカスタマーであるアマゾンの立場でのAI活用について触れた後、Amazon Novaを発表した。 Amazon Novaについては、日本の初期テスト顧客の中に「電通デジタル」が名を連ねている。彼らの目から見た生成AIとAmazon Novaの関係はどうなっているかも聞いた。
アマゾンがAWSの力で「安価で賢いAI」を開発
ジャシーCEOは2023年までAWSのCEOだったので、re:Inventには「帰ってきた」立場だ。 ストアでの活用や、アプリから使えるチャットAIである「Rufas」など最新の取り組みを解説したあとで、本命の発表である「Amazon Nova」を公開した。 Amazon Novaの特徴は「賢くて安い」ことだ。 ジャシーCEOは「Amazon Novaは他社の基盤モデルに対して高い性能を持っており、コストパフォーマンスでも75%も優れている」と自信を見せ、ベンチマークテストの結果も公表した。 Amazon Novaは、大きく分けて「understanding(解釈) model」と「Creative Content Generation(コンテンツ生成) model」の2つの領域がある。 解釈モデルは、モデルサイズごとに4つのカテゴリーが用意される。 小規模でテキストのみをサポートする「Nova Micro」、コストと速度重視の「Nova Lite」、機能と活用の幅がより大きな「Nova Pro」が公開された 数カ月以内には、より高性能で複雑なニーズに応えるための「Nova Premier」も提供を開始する。 例えば、テキストのみを扱う小型モデルである「Nova Micro」は、言語理解のベンチマークでグーグルの「Gemini 1.5 Flash」やメタの「Llama 3.1」(ともにパラメータ数は80億)よりも優れた結果を出している。 次に規模が大きく、画像や音声も扱える「Nova Lite」や「Nova Pro」では、OpenAIの「GPT-4o」には負けたものの、Anthropicの「Claude 3.5 Haiku」やグーグルの「Gemini 1.5」よりは良い結果を残しているという。 そして、コンテンツ生成は、画像生成用の「Nova Canvas」、動画生成用の「Nova Reel」がある。以下の動画をご覧いただければわかるが、すでにかなりの画質が実現できている。 さらに今後、音声認識・音声出力用の「Speech to Speech」と「Any to Any」モデルも公開される。前者は来年の第1四半期に、後者は2025年後半が予定されている。 後者の「Any to Any」は少しわかりにくいが、要は「人間と同じように、あらゆる情報を扱えるもの」と考えればいい。 音声の入力から画像を生み出したり、写真の入力から文章を生み出したりと、「入力情報と出力情報の種類が異なる」使い方ができる基盤モデルだ。 昨今、生成AIの世界ではいろいろな情報を扱う「マルチモーダルAI」が話題だが、NovaはMicro以外すべてマルチモーダルAIであり、中でもAny to Anyモデルは特別なもの、と言えそうだ。