Question

ある企業が、Amazon Bedrock 上のモデルを使った生成 AI 機能のコストを最適化したいと考えている。同一のシステムプロンプト（約 2000 トークン）を毎回送信しており、1 日あたり 10 万リクエストが発生している。最もコスト効率の高い最適化手法はどれか。

Accepted Answer

Bedrock のプロンプトキャッシング（Prompt Caching）機能を利用し、システムプロンプトのトークンを初回計算後にキャッシュして再利用する

Answer

システムプロンプトを毎回ユーザーメッセージの末尾に追加する形式に変更し、入力順序を最適化する

Answer

モデルを毎月ファインチューニングして、システムプロンプトの内容を重みに焼き込み、実行時のプロンプト送信を不要にする

Answer

リクエストをバッチ化して夜間にまとめて処理し、リアルタイム応答を廃止する

同じ分野の関連問題