DP-900Azure の分析ワークロードHARD単一選択

ある企業が Microsoft Fabric のレイクハウスアーキテクチャを採用し、Bronze(生データ)→ Silver(クレンジング済み)→ Gold(ビジネスロジック適用済み)のメダリオンアーキテクチャを実装したい。このアーキテクチャで Delta Lake 形式を各レイヤーで使用する主な利点はどれか。

  1. A. Delta Lake は ACID トランザクション・タイムトラベル(過去バージョン参照)・スキーマ進化をサポートし、各レイヤー間のデータ品質と変更管理を保証する
  2. B. Delta Lake は CSV 形式と完全互換であり、変換なしにそのまま BI ツールで参照できる
  3. C. Delta Lake を使うと SQL クエリが不要になり、すべての処理を GUI で実行できる
  4. D. Delta Lake はリレーショナルデータベースと同等の行ロックをサポートし、高頻度 OLTP 処理に最適化されている
解答と解説を見る

正解: A

Delta Lake はオープンソースのストレージレイヤーで、Parquet ファイルにトランザクションログを加えた形式である。ACID トランザクション(中間状態の整合性保証)・タイムトラベル(過去時点のデータをバージョン指定で参照)・スキーマ進化(後から列を追加しても過去データと互換性を保つ)をサポートするため、メダリオンアーキテクチャの各レイヤーでのデータ品質管理と変更追跡に適している。選択肢 B は誤りで、Delta Lake は Parquet ベースであり CSV 形式とは異なる。また CSV はそのままでは BI ツールで最適に参照できない。選択肢 D は誤りで、Delta Lake はファイルベースのストレージレイヤーであり、リレーショナル DB 相当の行ロック OLTP 処理ではなく、分析ワークロードに最適化されている。選択肢 C は誤りで、Delta Lake は SQL クエリを不要にするものではなく、むしろ Spark SQL や Fabric の SQL エンドポイントから SQL でアクセスできる点が利点の一つである。

▸ この試験を本気で演習する(全150問・無料)