Question

ある企業が、Azure OpenAI Service で GPT-4 を使った複数の生成 AI アプリケーションを運用しています。あるアプリで、特定のユーザー層に対してモデルが一貫して否定的な語調を使うことが判明しました。責任ある AI の「公平性」の観点からこの問題を調査・改善するために最も体系的なアプローチはどれか。

Accepted Answer

影響を受けるユーザーセグメントを特定し、同一の入力に対するモデル出力をセグメント間で比較評価し、バイアスの原因（プロンプト設計かモデル自体か）を切り分けた上でシステムプロンプトの修正と追加コンテンツフィルタリングを適用し、改善後も継続的モニタリングを実施する

Answer

GPT-4 から別のモデルに切り替えれば、バイアスの問題は自動的に解消される

Answer

問題を報告したユーザーに謝罪し、そのユーザーのアカウントを削除して問題を終結させる

Answer

バイアスは生成 AI の固有の特性であるため、ユーザーに「AI の出力は参考情報のみ」と免責事項を表示するだけでよい

同じ分野の関連問題