DP-900Azure の分析ワークロードMEDIUM単一選択

ある小売企業が、オンラインショップのクリックストリームデータを Azure Event Hubs で受信し、直近5分間の商品カテゴリ別のページビュー数をリアルタイムで集計して、Azure SQL Database に出力するシステムを構築したい。この処理に最も適したサービスはどれか。

  1. A. Azure Logic Apps:イベントをトリガーにして集計処理を実行するワークフロー
  2. B. Azure Data Factory:バッチ処理パイプラインでデータを移動・変換する
  3. C. Azure Stream Analytics:ストリーミングデータをウィンドウ関数で集計しシンクに出力する
  4. D. Azure Databricks:Spark ジョブで Event Hubs を読み込んで集計処理を行う
解答と解説を見る

正解: C

Azure Stream Analytics はストリーミングデータを SQL ライクなクエリでリアルタイムに集計・変換し、さまざまなシンク(Azure SQL Database・Blob Storage・Power BI など)に出力できるサービスである。タンブリングウィンドウ(直近5分間)を使った時間ベースの集計は Stream Analytics の得意とする処理であり、クエリを数行書くだけで実装できる。選択肢 B の Azure Data Factory はバッチ処理向けであり、リアルタイムのストリーミング集計には設計されていない。選択肢 D の Azure Databricks の Spark Structured Streaming でも同様の処理は実現できるが、Databricks クラスターの運用コストと設定の複雑さが増す。選択肢 A の Azure Logic Apps はイベント駆動のワークフロー自動化ツールであり、大量のストリーミングデータの集計処理には向いていない。

▸ この試験を本気で演習する(全150問・無料)