ある金融機関が、規制要件により過去7年間の取引履歴データを保持しつつ、毎月のバッチレポート処理でそのデータを分析する必要がある。データ量はテラバイト規模で増加し続けており、コスト効率も重視したい。Azure Synapse Analytics でこの要件に最も適したアーキテクチャはどれか。
- A. すべてのデータを専用 SQL プールに格納し、常時電源オンで維持する
- B. Azure Blob Storage にデータを格納し、Power BI Direct Query で毎月レポートを生成する
- C. Azure SQL Database のみを使用し、7年分のデータをすべて格納して毎月クエリする
- D. ADLS Gen2 にアーカイブデータを低コストで格納し、Synapse のサーバーレス SQL プールでオンデマンドクエリを実行。月次レポート時のみ専用 SQL プールを起動してバッチ処理を行い、完了後に一時停止する
解答と解説を見る
正解: D
ADLS Gen2 は低コストのストレージであり、7年分の履歴データを経済的に保持できる。普段はサーバーレス SQL プールでオンデマンドのアドホッククエリを実行し(クエリ量ベースの従量課金)、月次のバッチレポート処理には専用 SQL プールを起動(MPP で高速並列処理)し、処理完了後に一時停止することでコンピューティングコストを最小化できる。選択肢 A の専用 SQL プールの常時稼働は不要な時間の課金が発生し、テラバイト規模の長期保管データには非効率でコストが膨大になる。選択肢 C の Azure SQL Database は OLTP 向けであり、テラバイト規模の分析クエリのパフォーマンスと7年分のデータ保管のコスト効率は専用 SQL プールや ADLS Gen2 より劣る。選択肢 B の Power BI Direct Query をアーカイブ Blob Storage に直接接続するアーキテクチャは、テラバイト規模のデータに対するレポートクエリのパフォーマンスが著しく低下する。
📚 関連サービスの解説: Azure Synapse Analytics