DP-900コア データ概念MEDIUM単一選択

ある小売業者が、前日の全店舗売上データをもとに毎朝8時に自動レポートを生成するシステムを運用している。このシステムのデータ処理方式を他の方式と比較した場合の特徴として、最も正確に述べているものはどれか。

  1. A. バッチ処理はリアルタイム処理の一種であり、ストリーミング処理との技術的な違いはない
  2. B. バッチ処理はデータが発生した瞬間に処理するため、ストリーミング処理より高いリアルタイム性を実現できる
  3. C. バッチ処理はストリーミング処理より常に遅いため、あらゆるユースケースでストリーミングに置き換えるべきである
  4. D. ストリーミング処理と比べて、バッチ処理はデータのリアルタイム鮮度で劣るが、大量データの一括処理に特化しており、計算効率やコスト面で優れることが多い
解答と解説を見る

正解: D

バッチ処理の最大の特徴は、データをまとめて蓄積してから一括処理するため「大量データの効率的な一括処理」に優れる一方、処理タイミングがスケジュール依存となるため「リアルタイム鮮度」ではストリーミングに劣るというトレードオフにある。毎朝8時の自動レポートのように「鮮度は翌朝で十分」なユースケースではバッチ処理が適切でコスト効率も高い。選択肢Cは「あらゆるユースケースでストリーミングに置き換えるべき」という絶対的な主張が誤りである。レポート生成・月次集計など鮮度要件が低いユースケースではバッチ処理の方がシンプルでコスト効率が高い。選択肢Aはバッチ処理をリアルタイム処理の一種と説明しているが、定義上バッチ処理はリアルタイム処理ではなく、両者には明確な違いがある。選択肢Bはバッチ処理がデータ発生と同時に処理するとしているが、これはストリーミング処理の特性であり、バッチは蓄積してから一括処理する点で正反対の説明となる。

▸ この試験を本気で演習する(全150問・無料)