Question

ある企業が、Amazon Athena を使って S3 上のログデータ（CSV 形式、毎日約 100GB 追加）に対してアドホッククエリを実行している。Athena の月次コストが予算を超えており、クエリあたりのスキャン量を削減してコストを最小化したい。データは日付でパーティション分割されており、ほとんどのクエリは特定の日付範囲のみを対象とする。コード変更を最小限にしてコストを削減する最も適切な改善策はどれか。

Accepted Answer

CSV 形式のデータを Apache Parquet 形式に変換し、AWS Glue ETL ジョブで週次に変換する。Parquet は列指向・圧縮効率が高くスキャン量を大幅に削減できる。

Answer

Athena のクエリ実行ごとに S3 のデータを Redshift にロードして Redshift で実行する。

Answer

S3 バケットを Standard ストレージクラスから Standard-IA に移行し、ストレージコストを削減する。

Answer

Athena の結果キャッシュ機能を有効化して同一クエリの繰り返し実行コストをゼロにする。

同じ分野の関連問題