CData、Oracle/PostgreSQLからのリアルタイムデータストリームへの対応などを行ったデータ統合基盤の新版「CData Sync V24.3」をリリース
CData Software Japan合同会社(以下、CData)は9日、400種類以上のSaaS・DBデータをノーコードで統合できる「CData Sync」の新バージョン「V24.3」をリリースしたと発表した。 CData Syncは、基幹システムなどで使われているオンプレミスDBや、Salesforce/kintoneといったSaaSデータを、データ分析基盤にノーコードでパイプラインできるETL/ELTツール。 新バージョンでは、Oracle/PostgreSQLからのリアルタイムデータストリームをサポートした拡張型CDC(変更データキャプチャ)の機能を追加した。バッチ処理でデータの鮮度が低くなってしまうユースケースにおいて、今回のアップデートにより、リアルタイムでのデータ取得を実現し、最新データに基づいたアクションが可能となる。CData Sync側でのデータソースからのデータ取得はリアルタイムに行いつつも、レプリケーション先への反映を任意のタイミングで行うことも可能。また、以前のCDC機能と比較してデータソースDB側への負荷を軽減しているため、基幹システムなどの連携により適用しやすくなっている。 また、今回のアップデートでは、リバースETL機能の拡充を行った。これまで、CData SyncのリバースETL機能は書き戻し先としてSalesforceを対象とし、データソースはSnowflake、SQL Server、PostgreSQLを対象としていた。今回のアップデートでは、書き戻し先としてDynamics 365を加えており、また、リバースETLが可能なデータベースとして、新たにGoogle BigQueryとAmazon Redshiftの2つを追加した。 さらに、Snowflakeのパフォーマンス向上や、BigQueryにおけるマルチバイトカラム対応など、既存コネクタの機能強化を実施。SnowflakeのVariant型を用いたJSONデータのレプリケーションに対応したほか、Snowflakeへの大規模データの連携パフォーマンスを向上させた。テストでは、100万件規模のデータの同期速度が200%向上していることが確認されており、大量のデータ同期を必要とする大規模なビジネスにおいて、Snowflakeへのレプリケーションをよりスピーディーに行えるとしている。 CData SyncからBigQueryにレプリケーションする際には、マルチバイト文字を含んだカラム名を変換・変更なしで同期できるようになった。これまで、kintoneなどのようにデフォルトで日本語名カラムを含んだアプリケーションから、BigQueryにレプリケーションする際には、対象のカラム名を一つ一つ変換する必要があった。これにより、連携対象のカラムが複数ある場合などに、データ分析時のエクスペリエンスを損ねる要因となっていたが、今回のアップデートからこの変換が不要となった。
クラウド Watch,三柳 英樹