CDLデータイノベーションとAIMEDIUM単一選択

ある企業のデータエンジニアが、複数のデータソース(Cloud Storage、Cloud SQL、外部API等)からデータを収集・変換し、BigQueryにロードするETLパイプラインを構築したいと考えています。最も適切なGoogle Cloudのサービスはどれですか?

  1. A. Dataflow
  2. B. Firestore
  3. C. Cloud Memorystore
  4. D. Cloud Bigtable
解答と解説を見る

正解: A

DataflowはApache Beamを使ったフルマネージドのデータ処理サービスであり、ストリーミングとバッチ処理の両方に対応したETLパイプライン構築に適している。複数のデータソースからデータを取り込み、変換処理を施してBigQueryにロードするユースケースに最適。Cloud BigtableはNoSQL分析向けDB。Cloud MemorystoreはRedis/Memcachedのキャッシュサービス。FirestoreはNoSQLドキュメントDBであり、ETLパイプライン構築ツールではない。

▸ この試験を本気で演習する(全150問・無料)