ある企業が、Google Cloudのデータ活用戦略において「データガバナンス」を強化しようとしています。データガバナンスの実現に役立つGoogle Cloudのサービスを2つ選択してください。
- A. Cloud Bigtable:大規模NoSQLデータの高スループット読み書きサービス
- B. Cloud Data Catalog:BigQuery、Cloud Storage等のデータ資産のメタデータを管理・検索・タグ付けするデータカタログサービス
- C. Dataplex:データレイク/ウェアハウスを横断してデータのカタログ化・品質管理・アクセス制御を一元管理するデータガバナンスプラットフォーム
- D. Cloud DNS:ドメイン名の名前解決サービス
解答と解説を見る
正解: B, C
データガバナンスは誰がどのデータにアクセスでき、データの品質はどうか、データはどこにあるかを管理する取り組み。Dataplexはデータレイク/ウェアハウスにまたがるデータ資産を統一的に管理し、データゾーンのアクセス制御・データ品質チェック・データ系譜(Lineage)追跡を提供するデータガバナンス統合プラットフォーム。Cloud Data Catalog(現Dataplexに統合されつつある)はBigQueryやCloud StorageのデータアセットのメタデータをDiscovery・タグ付け・検索できるデータカタログ。Cloud BigtableはNoSQL DBでガバナンスツールではない。Cloud DNSはDNSサービスでデータガバナンスと無関係。
📚 関連サービスの解説: BigQuery ・ Cloud Storage