ある企業のデータエンジニアが、複数のソースシステムからデータを抽出し、データウェアハウスへ格納するためのパイプラインを構築したいと考えている。コードを書かずにデータの移動と変換を視覚的に設計できる最も適切な Azure サービスはどれか。
- A. Azure HDInsight:マネージド Hadoop・Spark クラスターサービス
- B. Azure Databricks:Apache Spark ベースのビッグデータ処理プラットフォーム
- C. Azure Stream Analytics:リアルタイムストリーミング分析サービス
- D. Azure Data Factory:コードフリーのビジュアルデータ統合サービス
解答と解説を見る
正解: D
Azure Data Factory はノーコード・ローコードでデータパイプラインを構築できるクラウドデータ統合サービスであり、ビジュアルなキャンバス上でソース接続・変換・シンクを設定するだけで ETL/ELT パイプラインを設計できる。90 種類以上のコネクタを標準搭載しており、オンプレミスからクラウドへのデータ移動にも対応する。選択肢 B の Azure Databricks は Spark ベースの高度な分析・機械学習プラットフォームであり、主にコードを書いてデータ処理を行う。選択肢 C の Azure Stream Analytics はリアルタイムストリーミング分析に特化しており、バッチ ETL パイプラインの設計には使わない。選択肢 A の Azure HDInsight はマネージド Hadoop クラスターであり、コードフリーのビジュアル設計ツールは提供していない。
📚 関連サービスの解説: Azure Data Factory