ある小売業者が、前日の全店舗売上データをもとに毎朝8時に自動レポートを生成するシステムを運用している。このシステムのデータ処理方式を他の方式と比較した場合の特徴として、最も正確に述べているものはどれか。
- A. バッチ処理はリアルタイム処理の一種であり、ストリーミング処理との技術的な違いはない
- B. バッチ処理はデータが発生した瞬間に処理するため、ストリーミング処理より高いリアルタイム性を実現できる
- C. バッチ処理はストリーミング処理より常に遅いため、あらゆるユースケースでストリーミングに置き換えるべきである
- D. ストリーミング処理と比べて、バッチ処理はデータのリアルタイム鮮度で劣るが、大量データの一括処理に特化しており、計算効率やコスト面で優れることが多い
解答と解説を見る
正解: D
バッチ処理の最大の特徴は、データをまとめて蓄積してから一括処理するため「大量データの効率的な一括処理」に優れる一方、処理タイミングがスケジュール依存となるため「リアルタイム鮮度」ではストリーミングに劣るというトレードオフにある。毎朝8時の自動レポートのように「鮮度は翌朝で十分」なユースケースではバッチ処理が適切でコスト効率も高い。選択肢Cは「あらゆるユースケースでストリーミングに置き換えるべき」という絶対的な主張が誤りである。レポート生成・月次集計など鮮度要件が低いユースケースではバッチ処理の方がシンプルでコスト効率が高い。選択肢Aはバッチ処理をリアルタイム処理の一種と説明しているが、定義上バッチ処理はリアルタイム処理ではなく、両者には明確な違いがある。選択肢Bはバッチ処理がデータ発生と同時に処理するとしているが、これはストリーミング処理の特性であり、バッチは蓄積してから一括処理する点で正反対の説明となる。