ある企業が Microsoft Fabric のレイクハウスアーキテクチャを採用した。OneLake に格納された Delta Lake 形式のデータに対して、データウェアハウス的な SQL クエリと、データサイエンティストによる Spark ノートブック分析の両方を同一データで実行したいと考えている。これを実現する Fabric の特徴として正しいものはどれか。
- A. Fabric では Spark と SQL を同時に使用するには Synapse Analytics への移行が必要になる
- B. Fabric では SQL とSparkは別々のストレージを必要とし、データをコピーして二重管理する必要がある
- C. Fabric の SQL エンドポイントは読み取り専用であり、Spark からのデータ更新は SQL では参照できない
- D. Fabric のレイクハウスは OneLake 上のデータを SQL エンドポイントと Spark ノートブックの両方から直接アクセスできる統一ストレージアーキテクチャを提供する
解答と解説を見る
正解: D
Microsoft Fabric のレイクハウスは OneLake という単一の論理ストレージ上にデータを格納し、SQL エンドポイント(T-SQL アクセス)と Spark ノートブックの両方から同一の Delta Lake 形式データに直接アクセスできる。データをコピーすることなく異なるコンピューティングエンジンで同一データを利用できる点が Fabric の大きな特徴である。選択肢 B は誤りで、Fabric は OneLake という統一ストレージによりデータの二重管理を不要にしている。選択肢 C は誤りで、Fabric の SQL エンドポイントは Delta Lake のトランザクションログを参照するため、Spark による更新も即座に SQL から参照できる。選択肢 A は誤りで、Fabric は Synapse Analytics とは独立したプラットフォームであり、移行は不要である。
📚 関連サービスの解説: Microsoft Fabric