Google Cloud分析

BigQueryとは

サーバーレスのフルマネージドデータウェアハウス。標準 SQL でペタバイト規模のデータを数秒でスキャンでき、インフラ管理やインデックス設計が不要。列指向ストレージにより集計クエリが高速。

オンデマンド(スキャンデータ量課金)とフラットレート(スロット予約)の 2 種類の料金体系がある。BigQuery ML を使うと SQL だけで機械学習モデルを作成・予測できる。

外部テーブル(BigQuery Omni・Biglake)でデータを Cloud Storage に置いたままクエリを実行でき、データ移動なしの分析が可能。Looker Studio との統合で可視化も容易。

試験での問われ方

CDL では DWH 構築・BI 連携のシナリオで必ず BigQuery が答えになる。バッチ分析向けであり、OLTP(高頻度の行単位更新)には向かないという点を常に意識する。

ACE では パーティションテーブル(日付や整数列でデータを分割しスキャン量を削減)とクラスタリング(特定列でデータを物理ソートし絞り込みを高速化)の違い、オンデマンド vs 予約スロットのコスト設計が頻出。引っかけとして、BigQuery はクエリ実行時にのみスロットを消費し、ストレージと演算は別課金。

このサービスが登場する演習問題(12問)

関連サービス