ある企業のデータエンジニアが、複数のデータソース(Cloud Storage、Cloud SQL、外部API等)からデータを収集・変換し、BigQueryにロードするETLパイプラインを構築したいと考えています。最も適切なGoogle Cloudのサービスはどれですか?
- A. Dataflow
- B. Firestore
- C. Cloud Memorystore
- D. Cloud Bigtable
解答と解説を見る
正解: A
DataflowはApache Beamを使ったフルマネージドのデータ処理サービスであり、ストリーミングとバッチ処理の両方に対応したETLパイプライン構築に適している。複数のデータソースからデータを取り込み、変換処理を施してBigQueryにロードするユースケースに最適。Cloud BigtableはNoSQL分析向けDB。Cloud MemorystoreはRedis/Memcachedのキャッシュサービス。FirestoreはNoSQLドキュメントDBであり、ETLパイプライン構築ツールではない。
📚 関連サービスの解説: Dataflow