Question

ある企業が、Amazon Bedrock 上で本番運用中の生成 AI アプリケーションのコストを削減したいと考えている。出力品質を維持しながらコストを最適化するための手法を2つ選択してください。

Accepted Answer

用途に応じてモデルを使い分け、シンプルな分類タスクには小型・低コストモデル、複雑な推論が必要なタスクにのみ大型モデルを使う

Accepted Answer

プロンプトの冗長な表現を削除し、必要最小限のコンテキストに絞ることで入力トークン数を削減する

Answer

高トラフィック時間帯のリクエストをキューに積み、低トラフィック時間帯にまとめて処理することでレイテンシを無視してコストを下げる

Answer

コスト削減のため、Bedrock Guardrails を無効化してトークン処理のオーバーヘッドをゼロにする

Answer

すべてのリクエストに対して max_tokens を最大値（例：4096）に設定し、常に長い回答を生成させる

ある企業が、Amazon Bedrock 上で本番運用中の生成 AI アプリケーションのコストを削減したいと考えている。出力品質を維持しながらコストを最適化するための手法を2つ選択してください。

同じ分野の関連問題