SBT、JR西日本の建設部門データを対象にRAGを用いた生成AIの実証実験
SBテクノロジー(SBT)は12月19日、JR西日本の建設部門データを対象に、RAG(検索拡張生成)技術を用いた生成AIの実証実験を実施したと発表した。 今回の実証実験は、JR西日本の建設部門が保有する膨大な鉄道建設工事に関するドキュメントに、生成AIによる回答精度の有用性を検証することを目的としたもの。過去の知見や技術ノウハウが蓄積されているデータを利活用することで、若手技術者の技術判断の精度向上を目指す。実証実験では、SBTが有する生成AIのノウハウを活用して、建設部門データの一部である約6万ファイルを取り込んだ検証システムを1カ月で開発し、RAGによる回答精度の検証で、情報の分類や分類に応じた回答生成に関して一定の有用性を確認した。 JR西日本は、「JR西日本グループデジタル戦略」で、顧客体験、鉄道システム、従業員体験の三つの再構築を掲げ、膨大なデータのデジタル化とその利活用を推し進めている。JR西日本の鉄道建設プロジェクトを担う大阪工事事務所では、担当者間のナレッジの引き継ぎという側面に加え、近年は熟練技術者が定年を迎えており、今後さらに組織の若年層化が進むことも見据え、鉄道や技術ノウハウに関する建設データをクラウドストレージサービスのBoxに管理・共有し、技術継承の取り組みを推進している。しかし、膨大な資料から過去の工事事例や安全・品質に関するルールの情報を検索する手間が大きな負担となり、いまだ熟練技術者の経験や知見に頼らざるを得ない状況だった。今回「従業員体験の再構築」として、こうした業務課題を解決できる技術力が求められていた。 SBTは、マイクロソフト製品に関する豊富な導入実績を有し、また自社での生成AI活用や、法人向け生成AIサービス「dailyAI」の提供など、生成AIに関するノウハウを多数有している。今回これらのナレッジを活用して、RAGを用いた情報検索システムを構築し、回答精度の有用性を確認する実証実験を行った。期間は2023年12月から24年3月まで。 実証実験では、Microsoft Azureのクラウド基盤に、Azure OpenAI Serviceによる生成AI検証システムを約1カ月で構築した。Azure Virtual Networkによるプライベートアクセスを構成したセキュリティー保護に加えて、生成AIに連携する前に個人情報を自動で削除するセキュリティー対策を実施し、Boxストレージに保管された約6万ファイルに対するセキュアな生成AI活用基盤として構築した。 検証システムではプロンプト(指示文)を入力することで、建設部門データの中から関連性のある情報を基に回答文を生成することができ、また各種パラメーターによって、生成AIの回答傾向を調整できる。 今回検証するデータのなかには、業務規定、過去の事故情報や施工計画書などの鉄道建設工事に関連するさまざまな種類のドキュメントが含まれており、また作成した人によって記載内容に表記ゆれが見られた(レールと線路、コンクリートとRCなど)。そのため、これらの表記ゆれを吸収・加味したうえで、さらなる情報検索の精度を上げるために、RAGを用いて検証を行った。また、検索時の利便性を高めるために、生成された回答の引用元となる関連ドキュメントリンクの提示に加えて、ファイル内容を端的に理解する文書タグの自動生成機能(機械設備、安全確保など)を実装した。これらの開発にあたっては、日々進化する生成AIの最新技術を取り入れるために、アジャイル開発の手法を用いて、短いサイクルで機能追加・改善を行った。 施工計画書、業務参考資料、契約書類などのさまざまな種類のドキュメントに対する適切な分類や、分類に応じた回答生成内容など、利便性を含め検証のベンチマークとした項目を総合的に検証し、一定の有用性を確認した。 今後は、今回の実証実験で得られた成果に加え、Microsoft製品に対する知見や生成AI、またセキュリティーに関するSBTのノウハウを生かし、JR西日本のさまざまな業務課題の解決に向けて継続的に支援を行っていく。