ある保険会社が、SageMaker で学習した保険料算出モデルを本番デプロイしました。数か月後、「新規顧客データの傾向が学習時と異なるため予測精度が低下している可能性がある」という懸念が出ました。モデルのデータドリフトを継続的に検出するために最も適切な AWS サービスの組み合わせはどれですか?
- A. Amazon SageMaker Experiments で新しい学習ジョブを毎週実行して性能を比較する
- B. AWS CloudTrail でエンドポイント呼び出しログを収集し、異常アクセスを検出する
- C. Amazon SageMaker Model Monitor のデータ品質モニタリングを設定し、本番エンドポイントへの入力データを自動的にベースラインと比較する
- D. Amazon SageMaker Clarify のバイアスレポートを月次バッチで実行する
解答と解説を見る
正解: C
Amazon SageMaker Model Monitor はデプロイ済みエンドポイントへの本番入力データをリアルタイムまたはスケジュールで監視し、学習時に作成したベースライン統計との乖離(データドリフト)を自動検出・アラートします。これがデータドリフト継続監視の標準的な手法です。DのSageMaker Clarify は学習フェーズのバイアス検出に主に使われ、本番データの継続的なドリフト検出には Model Monitor のほうが適しています。BのCloudTrail はセキュリティ監査用のAPIログであり、入力データの統計的変化は検出できません。AのExperiments で毎週再学習するのはリソース面でも非効率であり、ドリフト「検出」の前に都度再学習するアプローチは過剰です。
📚 関連サービスの解説: Amazon SageMaker