ある大手銀行が、不正取引検知システムをMLで構築しようとしています。取引データは1日数百万件発生し、不正取引は全体の0.01%未満です。このようなクラス不均衡問題を解決するMLアプローチとして、Google Cloudで最も推奨されるものはどれですか?
- A. Vertex AIでクラス重み付けやオーバーサンプリング(SMOTE等)、AUC-PR指標の最適化などのクラス不均衡対策を施した分類モデルを学習し、継続的なモデル監視を実施する
- B. BigQueryで不正取引と思われるパターンをSQLルールとして全件記述し、新規ルールを手動で追加し続ける
- C. 不正取引の件数が少ないため、正常取引のデータのみで学習した方が精度が高くなる
- D. クラスが不均衡なため、MLモデルは使用せず、ルールベースのみで検知する
解答と解説を見る
正解: A
クラス不均衡(不正0.01%)は不正検知MLの典型的な課題。Vertex AIでクラス重み付け(少数クラスを重視)、SMOTE等のオーバーサンプリング、精度よりAUC-PR(適合率-再現率曲線下面積)を最適化指標に使うなどのテクニックを組み合わせた上で、ドリフト監視(データ・予測の分布変化)を継続することが推奨。ルールベースのみでは新手の不正に対応できない。正常データのみで学習すると不正パターンを全く学習できない。BigQuery SQLルールは静的ルールであり進化する不正手口への対応が困難。
📚 関連サービスの解説: Vertex AI