DP-900コア データ概念HARD複数選択

ある企業が、IoT センサーからのリアルタイムストリームデータと、データウェアハウスに格納された過去5年間の履歴データを組み合わせた分析基盤を設計している。このアーキテクチャの要件として正しい説明を2つ選択してください。

  1. A. ストリーミングデータはデータウェアハウスに直接書き込むことで、リアルタイムと履歴データを同一エンジンで最もシンプルに処理できる
  2. B. 履歴データはリアルタイム処理が不要なため、ファイルシステムに一切インデックスなしで格納するのが最適である
  3. C. リアルタイムデータと履歴データを組み合わせる分析では、両方の処理を担う統合レイヤー(ラムダアーキテクチャやカッパアーキテクチャ)を検討する必要がある
  4. D. リアルタイムストリームにはイベントハブやメッセージキューなどのストリーミングプラットフォームが適しており、履歴データの大規模バッチ集計にはデータウェアハウスが適している
  5. E. バッチ処理はリアルタイム性が必要なIoTアラートに最も適した処理方式である
解答と解説を見る

正解: C, D

IoTリアルタイムデータと履歴データを組み合わせる場合、(1)リアルタイムストリームはAzure Event Hubs・Apache Kafkaなどのストリーミングプラットフォームで処理し、(2)履歴データの大規模バッチ集計はデータウェアハウス(Azure Synapse Analyticsなど)で処理するという役割分担が基本原則となる。さらにリアルタイムと履歴の両方を組み合わせる場合、ラムダアーキテクチャ(バッチレイヤー+スピードレイヤー)やカッパアーキテクチャ(ストリーミング統一)などのアーキテクチャパターンの検討が必要になる。選択肢Aは「ストリーミングデータをデータウェアハウスに直接書き込む」方式で、データウェアハウスは大量の高頻度ストリーミング書き込みには最適化されていない。高速書き込み・低レイテンシのストリーミングにはイベントハブなど専用基盤が適する。選択肢EはIoTアラートのリアルタイム要件にバッチ処理を当てているが、バッチはスケジュール処理で遅延が生じるためリアルタイムIoTアラートには不適切である。選択肢Bはインデックスなしでの格納は検索性能を著しく低下させるため、大規模な履歴データ分析には不適切な設計である。

▸ この試験を本気で演習する(全150問・無料)