ある HR テクノロジー企業が Amazon Bedrock を使って求人票から応募者の適性スコアを自動判定するシステムを開発している。モデルの出力に一貫性がなく、同じ応募者で実行するたびに異なるスコアが出力される。最も適切な対処法はどれか。
- A. top-p を 1.0 に設定してランダム性を最大化する
- B. ファインチューニングを実施してスコアリングロジックをモデルに組み込む
- C. 最大トークン数を増やして詳細なスコアリング根拠を生成させる
- D. temperature を低く(例: 0〜0.2)設定して出力の決定論性を高める
解答と解説を見る
正解: D
採用適性スコアのような判定業務では、同じ入力に対して毎回同じ結果が出る「一貫性」が重要。temperature パラメータはトークン選択のランダム性を制御し、0 に近いほど最も確率の高いトークンが選ばれやすくなり出力が安定する。temperature=0 は完全に決定論的な出力(貪欲法デコーディング)を意味する。Aの top-p=1.0 はすべてのトークンを候補として残すことを意味し、temperature と組み合わせてランダム性が残るため一貫性は改善しない。Bのファインチューニングはスコアリングロジックを埋め込む手段としてあり得るが、コストが高く、まず推論パラメータの調整という低コストな手段を試みるべき。Cの最大トークン数増加は一貫性とは無関係で、長い出力が必ずしも安定した出力になるわけではない。