DP-900Azure の分析ワークロードMEDIUM単一選択

ある企業が Azure Databricks でデータ分析チームを運営している。データエンジニア・データサイエンティスト・SQL アナリストが同一クラスターと同一データセットを使いながら、それぞれの好むインターフェースで作業できる環境を整えたい。Databricks がサポートする機能の組み合わせとして正しいものはどれか。

  1. A. Databricks のノートブックは Python・R・Scala・SQL の複数言語を混在させて使用でき、SQL ウェアハウス機能により SQL アナリストは標準 SQL インターフェースで同一データにアクセスできる
  2. B. Databricks は Python のみをサポートするため、SQL アナリストは別のツールが必要になる
  3. C. Databricks は機械学習ワークロードに特化しており、SQL によるデータ分析はサポートしていない
  4. D. Databricks ではデータエンジニアと SQL アナリストが別々のクラスターを必ず使用する必要があり、同一データを共有するにはデータのコピーが必要になる
解答と解説を見る

正解: A

Azure Databricks は Python(PySpark)・R・Scala・SQL を同一ノートブック内で使用できる多言語対応プラットフォームである。Databricks SQL(SQL Warehouse)機能により、SQL アナリストはクラスター設定の知識なしに標準 SQL インターフェースで Delta Lake や ADLS Gen2 上のデータを分析できる。同一の Delta Lake データを異なるロールの担当者が各自の得意ツールでアクセスできる点が大きな特徴である。選択肢 B は誤りで、Databricks は Python のみならず R・Scala・SQL を広くサポートしている。選択肢 C は誤りで、Databricks は機械学習だけでなく、データエンジニアリング・SQL 分析・BI 連携など幅広いワークロードに対応している。選択肢 D は誤りで、Databricks の Delta Lake はコピー不要で複数のクラスター・エンジンから同一データにアクセスできる統一ストレージを提供する。

▸ この試験を本気で演習する(全150問・無料)