ある企業が、データの品質問題(重複、欠損、誤入力等)に悩んでいます。ETLパイプライン内でデータクレンジングと変換を視覚的なUIで実施できるGoogle Cloudサービスとして、最も適切なものはどれですか?
- A. Cloud Storage Transfer Service
- B. Cloud Dataprep(Trifacta)
- C. Cloud Bigtable
- D. VPC Flow Logs
解答と解説を見る
正解: B
Cloud Dataprep(Trifacta製のマネージドサービス)は、コーディング不要のビジュアルインターフェースでデータのプロファイリング(品質確認)、クレンジング(重複除去、欠損補完、正規化等)、変換を実施できるデータ準備サービス。Dataflowと連携してBigQueryへのパイプラインも構築できる。Cloud Bigtableは高スループットNoSQL DB。Cloud Storage Transfer ServiceはGCSへのデータ転送サービス。VPC Flow Logsはネットワークフローのロギングでデータクレンジングとはまったく関係ない。