CDLデータイノベーションとAIMEDIUM単一選択

ある企業が、データの品質問題(重複、欠損、誤入力等)に悩んでいます。ETLパイプライン内でデータクレンジングと変換を視覚的なUIで実施できるGoogle Cloudサービスとして、最も適切なものはどれですか?

  1. A. Cloud Storage Transfer Service
  2. B. Cloud Dataprep(Trifacta)
  3. C. Cloud Bigtable
  4. D. VPC Flow Logs
解答と解説を見る

正解: B

Cloud Dataprep(Trifacta製のマネージドサービス)は、コーディング不要のビジュアルインターフェースでデータのプロファイリング(品質確認)、クレンジング(重複除去、欠損補完、正規化等)、変換を実施できるデータ準備サービス。Dataflowと連携してBigQueryへのパイプラインも構築できる。Cloud Bigtableは高スループットNoSQL DB。Cloud Storage Transfer ServiceはGCSへのデータ転送サービス。VPC Flow Logsはネットワークフローのロギングでデータクレンジングとはまったく関係ない。

▸ この試験を本気で演習する(全150問・無料)