ある企業が、ユーザーが複数ステップのタスク(「航空券を検索して予約して、確認メールを送って」)を自然言語で指示できる AI エージェントを構築しようとしている。このエージェントを実装する上で最も重要な設計考慮事項はどれか。
- A. エージェントが外部 API(予約システム・メールサービス)を呼び出すツール定義を明確に設計し、各ステップで実行前にユーザー確認(Human-in-the-loop)を挟む仕組みを構築する
- B. エージェントの全行動を事前に決定論的にハードコードし、LLM は一切の判断を行わない設計にする
- C. タスクを単一ステップのプロンプトに圧縮し、LLM に1回の推論で全ステップを完成させる
- D. LLM の知識だけでタスクを完遂させるため、外部 API への接続は不要と判断する
解答と解説を見る
正解: A
マルチステップエージェントでは、LLM がツール(外部 API)を呼び出して副作用(予約・メール送信)を起こすため、ツール定義の明確化と Human-in-the-loop(特に不可逆なアクション前の確認)が安全性の核心となる。Amazon Bedrock Agents はこのパターンをサポートする。Dは誤り:LLM の知識は静的であり、リアルタイムの航空券在庫・予約処理はツール(API)なしには実現不可能。Bは誤り:完全ハードコードでは LLM の自然言語理解の利点を活かせず、エージェントとしての価値がなくなる。Cは誤り:単一プロンプトによる多段タスクの完結は現実の API 呼び出しを伴う処理には対応できず、エラーハンドリング・状態管理も困難。