「AIデータクラウド」へ進化するSnowflake、大量の最新アップデートを紹介
Snowflakeは、11月に米国で開催された技術者向けカンファレンス「BUILD 2024」で発表した、製品の最新アップデートや技術情報についての国内向け記者説明会を開催した。現在は「AIデータクラウド」を掲げることもあり、AI/生成AI関連で多数の新発表がある。 【もっと写真を見る】
Snowflakeは、2024年11月12日から15日にかけて米本社主催で開催された技術者向けカンファレンス「BUILD 2024」で発表した、製品の最新アップデートや技術情報についての国内向け記者説明会を開催した。 「AIデータクラウド」に進化したSnowflake Snowflakeは、現在1万社以上の顧客企業が利用しており、99.99%のSLAを達成しながら、1日あたり50億件以上のジョブを処理しているという。また、Snowflakeに関係する開発者は、全世界で75万人以上に拡大しているという。 Snowflakeは、今年6月に開催した「Snowflake Summit」において、従来の「データクラウド」に変わる新たな方向性として「AIデータクラウド」を打ち出した。 メッセージを変えた狙いについて、Snowflake 執行役員 セールスエンジニアリング統括本部長の井口和弘氏は「AIを活用するにはデータが不可欠であり、データのサイロを解消しながら、セキュリティとガバナンスを効かせた活用が必要だ。Snowflakeは、AIのために、データをよりシンプルに活用できる世界を目指している」と説明する。 Snowflakeでは、マルチクラウドに対応した単一プラットフォームのアーキテクチャを採用しており、データウェアハウス(DWH)、データレイク、データレイクハウス、データメッシュ/データファブリックを一元的に活用できる。さらに、LLMやベクトルデータベースをマネージドサービスとして提供する「Cortex AI」、他社とのデータシェアリングやデータコラボレーションを可能にする「Snowgrid」もこのプラットフォームに統合されており、蓄積されたデータの柔軟な活用を可能にしている。 3つの基本方針に沿って多数の最新アップデートを紹介 井口氏は、BUILD 2024で発表されたアップデートについて、Snowflakeが掲げる3つの基本方針、「ニーズに応じた柔軟なデータとアーキテクチャ」「信頼できるエンタープライズAIとML」「データとAIのための比類なきコラボレーション」にまとめるかたちで説明した。 (1)「ニーズに応じた柔軟なデータとアーキテクチャ」 「Snowflakeオープンカタログ」(一般提供開始)は、Apache Iceberg向けのデータカタログであるApache Polarisを、Snowflakeがマネージドサービスとして提供するものだ。SnowflakeにあるIcebergテーブルも、他のプラットフォームにあるIcebergテーブルも、このカタログ上でシームレスに管理できるようになったという。 「ドキュメントAI」(一般提供開始)は、Snowflakeに組み込まれた独自のLLMを用いて、PDFなどの複雑な非構造化ドキュメントからデータを抽出し、構造化テーブルに変換するワークフローである。現時点では英語での対応(日本語は非対応)となっている。 「Snowflake Horizonカタログ」は、従来から持っていたデータカタログに名称を付けたもので、それと共に今回はセキュリティ監視機能を強化している。「Trust Centerの拡張」(プライベートプレビュー)では、Snowflakeのセキュリティパートナーが提供するカスタムスキャナパッケージにも対応を拡張して、多様なセキュリティニーズを一元的にカバーする。 「ハイブリッドテーブル」(一般提供開始)は、トランザクションデータ/分析データを統合して扱えるテーブルタイプ。2022年のSnowflake Summitで発表されていたが、パフォーマンスや拡張性で一定の水準を達成できたため、今回一般提供開始となった。これにより、OLTPとOLAPをひとつのデータプラットフォームで活用できる。 (2)「信頼できるエンタープライズAIとML」 ここではまず、Cortex AIについて説明した。 Cortex AIは、生成AIの活用に必要な一連の機能をフルマネージド型で提供するサービスだ。たとえば、Snowflakeにあるデータを活用してモデルをファインチューニングしたり、SQL文の中で生成AIによる翻訳や分析といった機能を呼び出したりすることができる。 さらに、主要なサードパーティ製LLMを選択できることも特徴だ。新たにAnthropicの「Claude 3.5 Sonnet」、Metaの「Llama 3.2」にも対応した。Llama 3.2はマルチモーダルLLMであり、画像など、テキスト以外のデータにも対応する。 今回のBUILD 2024では、ビジネスユーザー向けの生成AIアシスタント「Snowflake Intelligence」(プライベートプレビュー)が発表された。会話型のインタフェースを介して、構造化データおよび非構造化データの分析や要約、アクションが実行できる。 「Snowflake Intelligenceは、チャット関連の最上位機能と言える。たとえば販売記録やSharePoint、JiraやGoogle Workspaceといった生産性ツールのデータをシームレスに連携し、検索や問い合わせを行える。顧客からの要望が多かったため開発したもので、データ基盤を持つSnowflakeだからこそ実現できる機能だ」(井口氏) Cortex AIに組み込まれた「Cortex Chat API」(パブリックプレビュー)は、自然言語での問い合わせに対して自社が持つデータの検索を行ったうえで回答を行う、RAG対応のチャットボットAPIを提供する。サードパーティ製を含むLLMと、構造化データおよび非構造化ドキュメントの検索機能をオーケストレーションしてくれるため、フロントエンドのアプリケーションから単一のAPIを呼び出すだけで情報が取得できる。 「AIオブザーバビリティ」(プライベートプレビュー)は、Cortex AIや他の生成AIサービスを用いて構築したアプリケーションの評価やモニタリングを行うツールだ。関連性や根拠、レイテンシ、トークン数など、20以上の指標を検証し、追跡や比較もできるという。 非構造化ドキュメントの検索機能を提供する「Cortex Search」では、Snowflake Marketplaceでサードパーティが提供する独自データ(たとえばニュースや専門誌の記事、教科書、研究論文など)の検索を可能にする「Cortex Knowledge Extension」(プライベートプレビュー)、SharePointドキュメントの検索を可能にする「Snowflake Connector for SharePoint」(パブリックプレビュー)が発表された。いずれもAPIを介して、自然言語での問い合わせが可能だ。 なおSnowflakeでは、マイクロソフトとのパートナーシップを拡大し、Microsoft Power Platform向けのSnowflakeコネクタも発表している。これにより、SnowflakeとPower PlatformやDynamics 365との間で、データの相互運用性を簡素化できる。 そのほかにも、データ開発者向けの統合開発環境プラットフォーム「Snowflake Notebooks」(一般提供開始)、推論を実行するML(機械学習)モデルのパフォーマンスをモニタリングするオブザーバビリティツール(パブリックプレビュー)も発表されている。 (3)「データとAIのための比類なきコラボレーション」 「データとAIのための比類なきコラボレーション」については、生成AI活用が広がり、データを活用するための環境整備が重視されていることに呼応した取り組みを進めていると説明した。 「インターナルマーケットプレイス」(一般提供開始)は、社内に閉じたマーケットプレイスを提供する機能。社内の他の事業部門やチームが提供するデータ、アプリケーション、AIプロダクトを検索、活用できる。大手企業などの顧客から要望が上がっていたという。 そのほか、ファインチューニング済みのLLMモデルを他の企業に共有/販売できる機能(パブリックプレビュー)、マルチクラウド/マルチリージョン構成時のエグレスコストを最小化する「エグレスコストオプティマイザ」機能(一般提供開始)、Snowparkでコンテナ化した独自のSnowflakeアプリをマーケットプレイスで配布/販売できる機能(AWSで一般提供開始)なども発表している。 * * * 同説明会では、顧客企業におけるAI活用事例としてZoom(Zoom Communications)が紹介された。 Zoomでは、カスタマーサクセスチームにおいて、機械学習と生成AIを融合させたチャットボットを構築している。見込み客や顧客に関する営業チームの情報が「Salesforce」や「HubSpot」といった複数のシステムにサイロ化していたが、これをSnowflakeにまとめ、Streamlitを用いて会話型インタフェースを備えたチャットボットアプリを開発した。これにより、顧客に関する総合的な情報を、自然言語を通じて収集できるようになり、より効率的な顧客支援が行えるようになったという。 文● 大河原克行 編集● 大塚/TECH.ASCII.jp