AIF-C01AI と ML の基礎MEDIUM単一選択

あるゲーム開発会社が、チェスAIエージェントを学習させようとしています。大量のラベル付き対局データは持っていませんが、自己対局を繰り返しながら勝率を最大化させたいと考えています。この要件に最も適した機械学習のパラダイムはどれですか。

A. 強化学習（Reinforcement Learning）
B. 教師なし学習（Unsupervised Learning）
C. 教師あり学習（Supervised Learning）
D. 転移学習（Transfer Learning）

解答と解説を見る

正解: A

強化学習は、エージェントが環境と相互作用しながら報酬（勝利）を最大化するよう方策を学習するパラダイムです。ラベル付きデータが不要で、試行錯誤（自己対局）を通じて学習する点が本ケースの要件と完全に一致します。教師あり学習は正解ラベルが必要であり、ラベル付き対局データがない本ケースでは限界があります。教師なし学習はデータのパターン発見に用いるもので、勝率最大化という目的関数を持つ本ケースとは異なります。転移学習は事前学習済みモデルを別タスクに適用する手法で、ゼロから自己対局で学習する要件とは合致しません。

▸ この試験を本気で演習する（全150問・無料）

同じ分野の関連問題