AIF-C01AI と ML の基礎HARD単一選択

ある企業のMLチームが、ランダムフォレストモデルとディープニューラルネットワーク(DNN)モデルを比較評価しています。ランダムフォレストが DNN よりも適していると判断できる状況として最も適切なものはどれですか。

  1. A. 入力データが高解像度の画像データであり、空間的な特徴の自動抽出が必要な場合
  2. B. 入力シーケンスの長期依存関係をモデリングする必要がある自然言語処理タスクの場合
  3. C. 構造化された表形式データで、データ量が数千件〜数万件程度であり、モデルの解釈可能性も要求される場合
  4. D. 大規模な非構造化データ(テキスト・音声・画像が混在)を統合的に処理する必要がある場合
解答と解説を見る

正解: C

ランダムフォレストは構造化された表形式データ(tabular data)に対して優れた性能を示します。特に数千〜数万件規模のデータでは DNNが要求する大量データなしに高精度を達成でき、特徴量重要度(Feature Importance)を通じた解釈可能性も提供します。DNNは大量のデータと計算資源が必要で解釈が難しい反面、複雑なパターン学習に優れます。画像データの空間特徴抽出はCNN(畳み込みニューラルネットワーク)が専門とする領域であり、ランダムフォレストは不向きです。長期依存関係のモデリングはRNNやTransformerが得意とする領域です。非構造化データの統合処理は深層学習マルチモーダルモデルの領域であり、ランダムフォレストでは対応困難です。

▸ この試験を本気で演習する(全150問・無料)