Question

ある企業が、過去10年の採用データを使って人材推薦モデルを学習しました。社内の過去の採用傾向がデータに反映されており、特定の大学出身者への偏りが疑われます。この「履歴的バイアス（Historical Bias）」に対処するために、学習前の前処理段階で最も適切なアプローチはどれですか？

Accepted Answer

再重み付け（Reweighting）または再サンプリングによって、過小代表グループのサンプルの学習への影響を増やし、データセットの偏りを補正する

Answer

バイアスの原因となった過去データを完全に削除し、直近2年分のみで再学習する

Answer

学習データの量を2倍に増やして統計的な安定性を高める

Answer

保護属性（出身大学の系列など）を学習特徴量から除外することで（Fairness through unawareness）、モデルが属性を直接参照できないようにする

同じ分野の関連問題