複雑すぎる生成AIアプリ開発をシンプルに、オラクル「HeatWave GenAI」の狙い
オラクルが提供する「HeatWave GenAI」は、インメモリ型の並列分散クラスタ「HeatWave」の生成AI機能だ。データベース/レイクハウス、ベクトルストア、AutoMLなどの機能と同じクラスタ内のノードで生成AIを稼働させることで、これまで複雑だった実用的な生成AIアプリケーションの開発をシンプルにするという。その特徴や狙いをオラクルのチーフ・コーポレート・アーキテクトに聞いた。 【もっと写真を見る】
2024年10月、オラクルが「HeatWave GenAI」の機能強化を発表した。このHeatWave GenAIを使うことで、データベース(DB)内に搭載された生成AI(LLM)、セマンティック検索(類似性検索)のためのベクトルストア、機械学習(ML)を自動化するAutoMLを統合したシステムが、簡単かつセキュアに構築できるという。 10月下旬に来日した米オラクル チーフ・コーポレート・アーキテクトのエドワード・スクリーベン氏は、HeatWave GenAIの優位性を「AIの専門知識、データ移動、追加コストがすべて必要なしで生成AIのアプリケーションが開発できる」点だと語る。詳しく説明を聞いた。 HeatWaveクラスタのノード内に生成AI(LLM)も組み込み提供 そもそもHeatWave GenAIは、オラクルが開発するインメモリ/分散並列処理型のデータベースサービス「HeatWave」の組み込み機能のひとつである。今年6月に一般提供を開始した。 HeatWaveは、MySQLデータベースのトランザクション処理(OLTP)や分析処理(OLAP)の高速化エンジンとしてスタートし、その後、予測処理(AutoML)、大規模オブジェクトデータの高速分析処理(レイクハウス)などの組み込み機能も取り入れて、対象ユースケースを拡大してきた。オラクルのOCIだけでなく、AWSやMicrosoft Azureなどマルチクラウドで利用できるサービスだ。 ここに生成AI(LLM)やベクトルストアの機能を統合したのが、HeatWave GenAIである。10月の発表では、ベクトルストアにおける多言語対応(27言語)とOCRサポート、ベクトルストアの自動更新、JavaScriptからのHeatWave GenAI呼び出し対応といった新機能が追加されている。 HeatWave GenAIの優位性は、生成AI(LLM)やベクトルストア、さらに先述したOLTP/OLAPやレイクハウスといったアプリケーション開発に必要な機能が、単一のデータベース内(同一クラスタ内のノード)に組み込まれている点だと、スクリーベン氏は説明する。他のクラウドサービスの場合、たいていは個別に存在するコンポーネントをAPI経由でつなぎ合わせて使うことになるが、そうした複雑さが解消する。 「他社のデータベースサービスを使って生成AIアプリケーションを構築しようとすると、とても複雑なステップを踏むことになる。しかし、Heatwave GenAIであればSQL文でAPIを1つ呼び出すだけ。非常にシンプルだ」 たとえば「ベクトルストアの作成」処理(非構造化ドキュメントにエンベディング=ベクトル化を行い、メタデータなどと共にベクトルストアへ格納する)についても、複雑な手順を踏むことなく、SQL文でドキュメントの保存場所を指定するだけだと説明する。 加えて、HeatWave内でさまざまな処理が完結するために、データを移動させる必要もない。その点もセキュリティ面の優位性につながると説明する。 「HeatWaveを使うことで、エンジニアが(生成AI、機械学習といった)各分野の深い専門知識を持っていなくても成果が出せる、セキュリティも担保できる、そういうものを目標としている」 ベクトルストア作成(エンベディング)のパフォーマンスにも強い自信 HeatWaveにおけるベクトルストア作成(エンベディング)は、ユーザーが対象のドキュメントを指定(前出のSQL文を参照)するだけで、ドキュメントファイルからのテキスト抽出、セグメンテーション、エンベディング、ベクトルストアへの保管といった一連の処理が自動的に行われる仕組みだ。HeatWaveは最大512ノードまでのスケーラビリティを持つインメモリ型クラスタを基盤としており、システム内部では大規模な分散並列処理が行われる。 HeatWaveでは、処理のスケジューリングなどを自動的に調整、最適化してくれるため、「大変良いパフォーマンスを実現できる」(スクリーベン氏)という。オラクルが実施したベンチマーク結果に基づき、AWSが提供する「Amazon Bedrock」のナレッジベースと比べて「最大30倍高速で、コストは4分の1で済む」と強調した。 作成と同様に、ベクトルストアを利用するセマンティック検索の実行においても、クラスタでの分散並列処理による高いパフォーマンスが実現するという。こちらもベンチマークを実施した結果、「Google BigQuery」「Snowflake」「Databricks」と比較して「最大96倍のプライスパフォーマンスが実現する」と述べた(詳細な検証条件と結果はWebサイトで公開している)。 さらに、実際のユースケースではAutoMLで作成した機械学習モデルも適材適所で組み合わせて使うことで、出力(回答)の精度向上とコスト削減も図れるという。 一例として、HeatWave GenAIを採用しているフードデリバリーサービス「EatEasy」では、ユーザープロファイルに基づくレコメンドをAutoMLのモデルで、自然言語によるユーザーのリクエストをLLM+オブジェクトストアのセマンティック検索でそれぞれ処理し、最終的なメニュー提案を行っているという(記事冒頭のスライド参照)。 「HeatWave GenAIの発表以降、やはり“HeatWaveの機能に生成AIの機能がプラスされた”という組み合わせの部分に注目が集まっている。生成AIの活用で現実の価値を生み出すにはどうすればよいか、まだ見えていない企業も多いだろう。しかし、レイクハウスと高速なアナリティクス、そして生成AIを組み合わせて使えるHeatWaveの環境を使うことで、良いアイディアから価値のあるアプリケーションにつながる道筋が見えてくると考えている」 文● 大塚昭彦/TECH.ASCII.jp