ある企業のデータサイエンティストが、生成 AI モデルの出力に「ハルシネーション(Hallucination)」が発生していると報告した。この現象を最も正確に表すものはどれか。
- A. モデルが入力プロンプトを完全に無視して、まったく無関係な回答を返す現象
- B. モデルが同じ入力に対して毎回異なる出力を返すことによる再現性の低下
- C. モデルが事実と異なる情報を、あたかも正確であるかのように生成してしまう現象
- D. モデルが長文入力を処理できずに途中でテキストを打ち切ってしまう現象
解答と解説を見る
正解: C
ハルシネーションとは、LLM が確率的に最もらしいトークンを生成する過程で、実際には存在しない事実・参照・引用などを自信をもって出力してしまう現象である。Aは誤り:それはプロンプトの無視(ignoring context)であり別の問題。Bは誤り:それは温度パラメータ(temperature)による確率的変動であり、ハルシネーションとは異なる概念。Dは誤り:それはコンテキストウィンドウの超過やトークン生成数の上限(max_tokens)によるテキスト切り捨てであり、ハルシネーションとは別の現象。