AIF-C01AI と ML の基礎MEDIUM単一選択

あるゲーム開発会社が、チェスAIエージェントを学習させようとしています。大量のラベル付き対局データは持っていませんが、自己対局を繰り返しながら勝率を最大化させたいと考えています。この要件に最も適した機械学習のパラダイムはどれですか。

  1. A. 強化学習(Reinforcement Learning)
  2. B. 教師なし学習(Unsupervised Learning)
  3. C. 教師あり学習(Supervised Learning)
  4. D. 転移学習(Transfer Learning)
解答と解説を見る

正解: A

強化学習は、エージェントが環境と相互作用しながら報酬(勝利)を最大化するよう方策を学習するパラダイムです。ラベル付きデータが不要で、試行錯誤(自己対局)を通じて学習する点が本ケースの要件と完全に一致します。教師あり学習は正解ラベルが必要であり、ラベル付き対局データがない本ケースでは限界があります。教師なし学習はデータのパターン発見に用いるもので、勝率最大化という目的関数を持つ本ケースとは異なります。転移学習は事前学習済みモデルを別タスクに適用する手法で、ゼロから自己対局で学習する要件とは合致しません。

▸ この試験を本気で演習する(全150問・無料)