Gemini 2.0やGoogle Agentspaceなど、グーグル・クラウドが新サービスを紹介
グーグル・クラウド・ジャパン合同会社は17日、生成AI「Gemini」の最新モデルや、企業の生成AI活用を支援する「Google Agentspace」など、同社が提供する新サービスについて説明会を開催した。 【画像】Gemini 2.0 Flash グーグル・クラウド・ジャパン 執行役員 テクノロジー部門 兼 事業開発本部の寳野雄太氏が最初に紹介したのは、「Gemini 2.0 Flash」だ。同社のAIプラットフォーム「Vertex AI」で試験利用が可能になった。Gemini 2.0 Flashの詳細について寳野氏は「Gemini 1.5 Proと比較して約2倍高速で、リアルタイムに音声、動画、テキストの入出力が可能だ。また、自然言語からコードを生成する精度がGemini 1.5 Flashと比較して13.1%向上した」と説明する。 Gemini 2.0では、これまでのテキストでの出力に加え、音声出力が可能になったほか、モデル内でインライン画像とテキストを生成し、AIとの対話を通じて画像を編集できるようになった。また、Multimodal Live APIという新機能を用いてリアルタイムで画面や音声を共有し、インタラクションと会話をより自然に行うことも可能だ。さらに、コード実行やGoogle検索からの情報検索もVertex AI上でできるようになる。 画像生成・編集AI「Imagen 3」の新機能もVertex AIにて提供開始した。テキストから画像を生成するだけでなく、新たに一般提供が開始された編集機能では、マスクを使用して既存の画像に変更を加えることができる。「例えば、画像の挿入や削除、背景の変更、見えていない部分の作成などができ、商品画像にきれいな背景を追加することも可能だ」と寳野氏はいう。 Imagen 3にはカスタマイズ機能も新たに追加された。マスクなしの参照画像から生成が可能で、例えばソファの参照画像に「ソファに座る家族」とテキストプロンプトを与えると、家族がソファに座っている様子を生成する。寳野氏は「この機能によって、製品カタログなどの画像を容易に生成できる」としている。 動画生成AI「Veo on Vertex AI」のプライベートプレビューも開始した。テキストから動画を生成するText to Video機能と、既存の画像にモーションを追加するImage to Video機能が利用可能だ。 第6世代TPU「Trillium」の一般提供も開始している。Trilliumは東京リージョンで利用可能となり、Gemini 2.0のインフラ運用に使用されている。前世代と比較してトレーニング速度が4倍、推論パフォーマンスが3倍向上しており、「非常に高いパフォーマンスを求めるモデルでも、効率的なトラフィック処理が可能だ」と寳野氏は述べている。 ■ 企業の生成AI活用を支援する「Google Agentspace」 次に寳野氏は、「企業における生成AIの活用はコンシューマー向けよりも複雑だ」と述べ、その課題としてサイロ化された検索やエージェントの乱立、適切なアクセスコントロール、文章データや質問への回答を探す時間の浪費などを挙げる。 こうした課題を解決するために登場したのが「Google Agentspace」だ。「Google Agentspaceは、データの保存場所に関わらず、Geminiの高度な推論とGoogle品質の検索を統合するエージェント。企業データ全体を統合することで、従業員の専門性を高める」と寳野氏はいう。 Google Agentspaceでは、大企業における複雑な情報探索や、エキスパートエージェントによる業務の自動化、NotebookLMの活用による企業データの新しい活用方法などが可能となる。 Google Agentspaceの検索機能について寳野氏は、「Google品質の検索技術とデータ技術をエンタープライズに持ち込んだものだ」と話す。「画像やビデオも理解した上で情報を提供する。ナレッジグラフでは、言葉の意味を理解し、内容をグラフ構造にして文章や単語の理解力を高める。Googleのウェブ検索と組み合わせた情報で、より適切で最新の回答を提供する」(寳野氏)。 Microsoft SharePointやSlackなど、Google以外のエンタープライズ製品と接続できるコネクタも提供する。また、構成済みのエージェントや、ノーコードおよびローコードで顧客自身が作成したエージェントをAgentspaceに組み込むことも可能だ。 このほか寳野氏は、Google Agentspaceに含まれる「NotebookLM Enterprise」も紹介した。NotebookLM Enterpriseは、SEC4やHIPAAなどの高度な認証とデータ保護に対応する。OktaやAzure ADといったすでに導入済みの企業内IDを利用できるため、追加のGoogle Workspace IDは不要だ。また、構成済みのCloud IAMロールで権限共有ができるほか、Microsoft Word、PowerPoint、Excelなどのフォーマットにも対応しており、Google Workspaceのユーザーでなくとも導入が可能だという。 Google Agentspaceには、3つの販売エディションが用意されている。それぞれのエディションについて寳野氏は、「NotebookLM Enterpriseは、NotebookLMを単独で提供するもの。Google Agentspace Enterpriseは、SharePointなどのデータソースとの統合的な検索を必要とする場合に適している。Google Agentspace Enterprise Plusは、アプリケーションに対するアクションが実行できる最上位エディションで、顧客独自の追加エージェントも利用可能だ」と説明する。 Google Agentspaceは日本語にも対応しており、日本国内での対応も予定しているという。
クラウド Watch,藤本 京子