AIエージェントの発展とRAGの新境地、「エージェンティックRAG」が注目される理由
既存RAGの課題、ハルシネーションやコンテキスト理解不足など
企業における生成AI活用では、情報の正確性が特に重視される。そのため、生成AIを利用する場合、検索拡張生成(RAG)の導入が一般的となっている。RAGとは、生成AIに外部データベースを接続することで、より正確な回答を生成する手法。RAGは特に文書要約やシンプルなクエリへの回答で優れたパフォーマンスを発揮するといわれている。 しかし、既存のRAGシステムには、いくつかの課題が存在する。課題は大きく4つに分類される。 第1の課題は、RAGだけでは情報の正確性が担保できないことだ。たとえば、営業担当者が商談の売上を問い合わせた場合、チャットログやメール、CRMなど、複数のデータソースが参照対象に含まれる。この場合、CRMが最も信頼できる情報源となるはずだが、RAGシステムは、自律的にそのことを判断できないため、古いメールから誤った情報を引用してしまう可能性がある。 第2の課題は、ハルシネーションの問題。生成AIの特徴である自然な文章生成能力は、時として正確さを損ねる原因にもなる。生成AIは、データの要約時に、情報を歪曲したり、存在しない事実を追加したりする傾向があるためだ。RAG活用により、ハルシネーションの可能性は下がるとされるが、完全にハルシネーションリスクを排除することは難しいのが現状となっている。 第3の課題は、企業固有のコンテキストを理解できない点が指摘される。企業では、固有の用語や略語が頻繁に使用される。しかし、RAGシステムは企業固有のコンテキストを持たないため、これらの用語をキーワードとして扱うか、さらには誤ったスペルとして補正してしまう可能性がある。 第4の課題は、スケーラビリティの問題。企業の情報システムには、テラバイトからペタバイト規模のデータが存在する。数十億のファイルやドキュメントから構成される膨大なデータを、既存のRAGシステムで効率的に処理することは難しい。検索時に関連性の高い文書を適切に抽出できなければ、生成AIは情報を正しく要約することができず、誤ったアウトプットを出力してしまう可能性が高まる。 これらの課題は、基本的なRAGシステムでは解決が困難といわれる。そこで注目されているのが、AIエージェントの仕組みを組み込んだ「エージェンティックRAG」だ。