Amazon Rekognition の概要と試験出題ポイント

Amazon Rekognition の概要と試験出題ポイントは？

AWSサービスの一つであるAmazon Rekognitionはどんな内容なのでしょうか？また、AWS認定資格のソリューションアーキテクト-アソシエイト(SAA)に合格するためには、サービスのどんなポイントを押さえておけばよいのでしょうか？
ここでは、そんなあなたの疑問に回答していきたいと思います

Amazon Rekognition 徹底解説 | AWS認定試験の頻出ポイントまとめ

1. サービス概要

Amazon Rekognitionは、画像と動画にコンピュータビジョン機能を追加するフルマネージドAIサービスです。ラベル検出、顔検出、顔比較、顔検索、テキスト検出、著名人認識、画像プロパティ分析、コンテンツモデレーション、PPE検出、Face Liveness、Custom LabelsなどをAPIで利用できます。

認定試験では、S3に保存した画像/動画を解析するマネージドサービスとして、Amazon Textract（書類OCR）、Amazon Comprehend（自然言語処理）、Amazon Bedrock（生成AI）との違いが問われます。 Rekognitionは「一般的な画像・動画の視覚解析」、Textractは「帳票・表・フォームを含む文書抽出」と整理すると選択しやすくなります。

2. 主な特徴と機能

2.1 ラベル・シーン・画像プロパティ検出

DetectLabelsは画像内の物体、シーン、概念を検出し、信頼度スコアと位置情報を返します。 Image Propertiesでは画質、明るさ、シャープネス、主要色などを取得でき、メディア管理や品質チェックに利用できます。

2.2 顔検出・顔比較・顔検索

DetectFacesは顔の位置や属性を検出し、CompareFacesは2つの画像に含まれる顔の類似度を比較します。顔検索ではCollectionに顔ベクトルをIndexFacesで登録し、SearchFaces/SearchFacesByImageで類似顔を検索します。本人確認やメディア整理で使われますが、プライバシーと法令遵守が必須です。

2.3 Face Liveness

Rekognition Face Livenessは、顔認証時に印刷写真、画面表示、動画、3Dマスク、注入攻撃などのなりすましを検出し、ユーザーが実際にカメラ前にいるかを判定する機能です。金融、会員登録、本人確認などで試験に出やすい新しい論点です。

2.4 コンテンツモデレーションとテキスト検出

DetectModerationLabelsは成人向け、暴力、不適切表現などの安全でないコンテンツを階層ラベルと信頼度で返します。 DetectTextは画像や動画内の印刷文字・手書き文字を検出しますが、請求書や表を構造化抽出する用途はTextractを選びます。

2.5 動画解析とストリーミング

保存済み動画はS3上のオブジェクトに対してStartLabelDetection、StartFaceDetection、StartContentModerationなどの非同期ジョブで解析し、SNS通知を受けてGet系APIで結果を取得します。ストリーミング動画ではKinesis Video Streamsと連携し、リアルタイムイベント検出を構成できます。

2.6 Custom Labels

Rekognition Custom Labelsは、ロゴ、製品、部品、不良品など一般モデルでは十分に検出できない独自ラベルを、少量の学習データでカスタムモデル化する機能です。 SageMakerで独自CVモデルをゼロから構築するより簡単に、特定ドメインの画像分類/物体検出を実装できます。

3. アーキテクチャおよび技術要素

アプリケーションまたはLambdaが画像バイト列、またはS3上の画像/動画オブジェクトをRekognition APIへ渡す。
同期画像API（DetectLabels、DetectFaces、CompareFaces、DetectTextなど）はJSONで即時結果を返す。
保存済み動画はStart系APIで非同期ジョブを開始し、SNS通知後にGet系APIで結果を取得する。
顔検索ではCreateCollectionでCollectionを作り、IndexFacesで顔を登録し、SearchFacesByImageなどで検索する。
結果をDynamoDB、OpenSearch Service、S3、RDSなどに保存し、検索、審査、ワークフロー、通知へ連携する。
CloudTrail、CloudWatch、IAM、KMS、S3バケットポリシーで監査と保護を行う。

Rekognition自体はモデル基盤を管理する必要がなく、スケーリングもマネージドです。設計では「同期画像APIか、非同期動画ジョブか、独自ラベルが必要か」を最初に切り分けます。

4. セキュリティと認証・認可

IAM最小権限: rekognition:DetectLabels、rekognition:IndexFaces、rekognition:StartLabelDetectionなど必要なAPIだけを許可する。
S3アクセス制御: 入力画像/動画、出力結果、Custom Labels学習データをS3に置く場合はバケットポリシー、IAM、ブロックパブリックアクセスを適切に設定する。
暗号化: S3オブジェクト、SNS通知先、関連ログやデータストアでKMS暗号化を利用する。
監査: CloudTrailでRekognition API呼び出しを記録し、CloudWatchでアプリケーションログやジョブ状況を監視する。
プライバシー: 顔認識、顔検索、Face Livenessは本人同意、データ保持、地域法令、利用目的の明確化が重要。
結果の扱い: 信頼度スコアは確率的な推定であり、重要判断では人間レビューやしきい値調整を組み合わせる。

5. 料金形態

RekognitionはAPIの種類、処理量、保存する顔メタデータ、Custom Labelsの学習/推論リソースなどに応じて課金されます。

画像解析: DetectLabels、DetectFaces、DetectText、DetectModerationLabelsなど、画像処理単位で課金される。
動画解析: 保存済み動画は処理した動画時間（分単位など）に応じて課金される。
顔コレクション: 顔メタデータの保存、IndexFaces/SearchFacesなどのAPI利用が課金対象になる。
Face Liveness: セッションやチェック利用量に応じて課金される。
Custom Labels: モデルのトレーニング時間、稼働中の推論時間、処理画像数などが課金対象になる。
周辺コスト: S3保存、SNS通知、Lambda処理、データ転送、ログ保存も合算して見積もる。

6. よくあるアーキテクチャ・設計パターン

UGCモデレーション: S3アップロードをLambdaで受け、DetectModerationLabelsを呼び出し、DynamoDBやレビューキューへ判定結果を保存する。
メディア検索: 画像/動画をDetectLabelsでタグ付けし、OpenSearch Serviceへメタデータを登録して検索可能にする。
本人確認: CompareFacesで本人画像と証跡画像を比較し、Face Livenessでなりすましを抑制する。
顔コレクション検索: IndexFacesで既知人物をCollectionへ登録し、SearchFacesByImageで一致候補を取得する。
保存済み動画解析: S3動画にStart系APIを実行し、SNS通知で完了を受け、Get系APIで結果を保存する。
独自物体検出: Custom Labelsで製品ロゴ、部品、欠陥などドメイン固有ラベルを検出する。

7. 設定・デプロイ手順（ハンズオン例）

S3バケットを作成し、画像または動画をアップロードする。ブロックパブリックアクセスと暗号化を確認する。
LambdaまたはCLI/SDK用のIAMロールに、必要なRekognition APIとS3読み取り権限を付与する。
画像解析ではDetectLabels、DetectText、DetectModerationLabelsなどを呼び出し、信頼度しきい値を設定する。
顔検索ではCreateCollection、IndexFaces、SearchFacesByImageの順で動作確認する。
動画解析ではStartLabelDetectionなどを実行し、SNS通知を受けてGetLabelDetectionなどで結果を取得する。
結果をDynamoDB/OpenSearch/S3へ保存し、CloudTrailとCloudWatchで監査・運用監視を設定する。

8. 試験で問われやすいポイント

8.1 サービス選択

Q: Amazon Rekognitionは何をするサービス？
A: 画像と動画からラベル、顔、テキスト、不適切コンテンツ、著名人、PPEなどを検出するマネージドAIサービス。
Q: 書類の表やフォームを構造化して抽出したい場合はRekognition？
A: いいえ。帳票や表、フォームのOCRはAmazon Textractを選ぶ。
Q: テキストの感情分析やエンティティ抽出をしたい場合は？
A: Amazon Comprehendを選ぶ。

8.2 画像API

Q: 画像内の物体やシーンをタグ付けするAPIは？
A: DetectLabels。
Q: 画像内の顔の位置や属性を検出するAPIは？
A: DetectFaces。
Q: 2つの画像の顔が同一人物か比較するAPIは？
A: CompareFaces。
Q: 画像内の文字を検出するAPIは？
A: DetectText。ただし帳票構造の抽出はTextract。
Q: UGCの不適切画像を自動検出するAPIは？
A: DetectModerationLabels。

8.3 顔検索と本人確認

Q: 顔検索用に顔を登録する保存先は？
A: Face Collection。IndexFacesで顔メタデータを登録する。
Q: 登録済みCollectionから画像に似た顔を検索するAPIは？
A: SearchFacesByImageまたはSearchFaces。
Q: 顔認証時の写真・動画・マスクなどのなりすましを検出するには？
A: Rekognition Face Livenessを使う。
Q: 顔認識結果をそのまま重要判断に使ってよい？
A: いいえ。信頼度しきい値、人間レビュー、同意取得、法令遵守を組み合わせる。

8.4 動画解析

Q: S3上の保存済み動画を解析する方式は？
A: StartLabelDetectionなどのStart系非同期APIを使い、完了後にGet系APIで結果を取得する。
Q: 動画解析ジョブの完了通知に使う代表サービスは？
A: Amazon SNS。必要に応じてLambdaやSQSへ連携する。
Q: ストリーミング動画のリアルタイム解析で連携する代表サービスは？
A: Amazon Kinesis Video Streams。

8.5 Custom Labelsと料金

Q: 一般モデルで検出できない自社ロゴや製品欠陥を検出したい場合は？
A: Rekognition Custom Labelsを使う。
Q: Rekognitionの主な課金軸は？
A: 画像処理数、動画処理時間、顔メタデータ保存/API、Face Liveness、Custom Labelsの学習/推論時間など。
Q: 画像解析パイプラインで入力ファイルを安全に保管するには？
A: S3のブロックパブリックアクセス、IAM最小権限、KMS暗号化、CloudTrail監査を組み合わせる。

AWS認定資格 WEB問題集＆徹底解説
会員登録/ログイン