Question

ある企業が生成 AI モデルのファインチューニングを検討している。保有するトレーニングデータは 500 件の例文しかない。この状況でファインチューニングを実施した場合に最も発生しやすい問題はどれか。また、その問題を緩和するための最も適切な代替アプローチはどれか。

Accepted Answer

過学習（Overfitting）が発生し、トレーニングデータに過度に適合して汎化性能が低下する。Few-shot プロンプティングまたは RAG による対応が適切

Answer

500 件のデータでファインチューニングすると、元モデルの知識が完全に上書きされて使えなくなる

Answer

データ量が少ないほどモデルが速く収束するため、500 件は理想的なデータ量である

Answer

ファインチューニングではなく、モデルをゼロから事前学習（Pre-training）する方が 500 件では効果的である

同じ分野の関連問題