Question

ある企業が AWS 上で Amazon Redshift クラスターを運用しており、毎日数十のバッチクエリが実行されています。最近、特定の大規模クエリの実行時間が急増しており、クエリのキューイングが発生してダッシュボードの更新が遅延しています。ワークロードを調査したところ、ETL バッチクエリ（長時間・大量データスキャン）とダッシュボードクエリ（短時間・低レイテンシー要件）が同じキューで競合していることが判明しました。最もコスト効率よくパフォーマンスを改善するには、どの方法が適切ですか？

Accepted Answer

Redshift の WLM（ワークロード管理）を設定し、ETL バッチクエリ用のキューとダッシュボード用の低レイテンシークエリキューを分離する。Redshift Serverless または Concurrency Scaling を有効化して、ピーク時のクエリコンカレンシーを自動スケールで処理する

Answer

ダッシュボードクエリを Amazon Athena に移行し、S3 のデータに直接クエリする

Answer

Redshift クラスターのノード数を増加させてコンピューティングキャパシティを追加する

Answer

Redshift クラスターを Amazon EMR Spark クラスターに移行し、Spark SQL でクエリを処理する

同じ分野の関連問題