Amazon Comprehendとは
自然言語処理(NLP)を使ってテキストからエンティティ(人名・場所・組織)・キーフレーズ・感情・言語・個人情報(PII)などを抽出するマネージドAIサービス。
カスタム分類器とカスタムエンティティ認識器を独自のトレーニングデータで作成し、業界固有の分類に対応できる。バッチ処理(S3入力)とリアルタイム処理の両方をサポート。
試験での問われ方
AIFでは「テキスト分析・センチメント分析・PII検出」のユースケースでComprehendを選ぶ。Rekognition(画像・動画)・Textract(ドキュメントOCR)・Transcribe(音声→テキスト)・Translate(翻訳)との役割分担を整理しておく。抽出できるエンティティタイプ(人名・場所・組織・日付・数量など)の例や、独自ラベルで文書を仕分けるカスタム分類、業界固有の用語を拾うカスタムエンティティ認識といった機能も押さえる。
PII検出と削除機能はGDPRコンプライアンス対応で問われる。診療記録など医療テキストに特化したComprehend Medicalは別サービスとして用意されている点も確認しておく。
近年はBedrock Guardrailsでも有害コンテンツのフィルタリングやPII検出・マスキングができるようになっており、AIFでは『生成AIの入出力を守るならGuardrails、汎用のテキスト分析・分類ならComprehend』という使い分けが問われる。
このサービスが登場する演習問題(3問)
- 【CLF-C02】ある企業が、AWSのAIサービスを使って、顧客サービスセンターに届く大量のメール文書を自動的に感情分析(ポジティブ/ネガ…
- 【AIF-C01】ある企業が、プロプライエタリな LLM API(外部サービス)を使って顧客の個人情報(PII)を含む問い合わせを処理する…
- 【AIF-C01】ある企業が S3 に蓄積された顧客の注文履歴テキストに、氏名・メールアドレス・クレジットカード番号などの PII が含ま…