AI-900機械学習の基本原則HARD単一選択

ある医療診断AIの開発チームが、モデルの公平性(Fairness)を評価したところ、特定の人口統計グループ(高齢者)に対して再現率が他のグループより著しく低いことが判明した。この問題の根本原因として最も可能性が高いものはどれか。

  1. A. モデルのアーキテクチャ(層の数)が少なすぎるため、複雑なパターンを学習できない
  2. B. Azure Machine Learning のデフォルト設定が特定の人口統計を考慮しない仕様になっている
  3. C. 高齢者は若年層に比べてデジタルデータが多く、過学習が起きている
  4. D. 訓練データに高齢者サンプルが少なく、このグループの特徴をモデルが十分に学習できていない(訓練データの偏り)
解答と解説を見る

正解: D

公平性の問題の多くは訓練データの偏りに起因する。特定の人口統計グループが訓練データに少ない場合、モデルはそのグループの特徴を十分に学習できず、再現率(見逃し率)が悪化する。医療AIでは高齢者・少数民族・女性などが訓練データで過小代表されることが多く、責任ある公平性評価が重要。Aのアーキテクチャの層数はモデル全体の表現力の問題であり、特定グループのみの再現率低下を説明しない。Cの「高齢者のデータが多い」は現実とも本問の設定とも一致しない。Bのような特定グループを無視するAzure MLの設定仕様は存在しない。Azure MLのResponsible AI機能はむしろ公平性の評価を支援する。

▸ この試験を本気で演習する(全150問・無料)