AWSAI・機械学習

Amazon Comprehendとは

自然言語処理(NLP)を使ってテキストからエンティティ(人名・場所・組織)・キーフレーズ・感情・言語・個人情報(PII)などを抽出するマネージドAIサービス。

カスタム分類器とカスタムエンティティ認識器を独自のトレーニングデータで作成し、業界固有の分類に対応できる。バッチ処理(S3入力)とリアルタイム処理の両方をサポート。

試験での問われ方

AIFでは「テキスト分析・センチメント分析・PII検出」のユースケースでComprehendを選ぶ。Rekognition(画像・動画)・Textract(ドキュメントOCR)・Transcribe(音声→テキスト)・Translate(翻訳)との役割分担を整理しておく。抽出できるエンティティタイプ(人名・場所・組織・日付・数量など)の例や、独自ラベルで文書を仕分けるカスタム分類、業界固有の用語を拾うカスタムエンティティ認識といった機能も押さえる。

PII検出と削除機能はGDPRコンプライアンス対応で問われる。診療記録など医療テキストに特化したComprehend Medicalは別サービスとして用意されている点も確認しておく。

近年はBedrock Guardrailsでも有害コンテンツのフィルタリングやPII検出・マスキングができるようになっており、AIFでは『生成AIの入出力を守るならGuardrails、汎用のテキスト分析・分類ならComprehend』という使い分けが問われる。

このサービスが登場する演習問題(3問)

関連サービス