ある企業が、ETL と ELT の2つのアプローチを比較検討している。クラウドデータウェアハウス(Azure Synapse Analytics)の強力な計算能力を最大限に活用するという観点で、ELT が ETL より優れている主な理由はどれか。
- A. ELT はオンプレミスのサーバーで変換処理を行うため、クラウドのネットワーク転送コストを削減できる
- B. ELT は変換処理を省略してデータを直接ロードするため、データ品質の確保が不要になる
- C. ELT は生データをまずデータウェアハウスにロードし、ウェアハウス側のスケーラブルな計算能力を使って変換するため、中間サーバーが不要になる
- D. ELT はデータをロードする前に完全に変換するため、データウェアハウス内のストレージを節約できる
解答と解説を見る
正解: C
ELT はデータを変換前にターゲット(クラウドデータウェアハウス)にロードし、ウェアハウス側の大規模並列処理(MPP)エンジンを使って変換処理を行う。Azure Synapse Analytics のような大規模分散コンピューティングをそのまま変換処理に活用できるため、ETL のように別途変換サーバーを用意する必要がなく、スケーラビリティとコスト効率が向上する。選択肢 D は ETL の説明に近い(変換後にロード)。ELT では変換前の生データもロードするためストレージは増える場合がある。選択肢 A は誤りで、ELT の変換処理はクラウド(データウェアハウス)側で実行するものであり、オンプレミスでの変換は ETL 的なアプローチである。選択肢 B は誤りで、ELT でも変換処理(クレンジング・データ品質確保)は重要であり、変換を省略するわけではない。