AWS認定資格 WEB問題集&徹底解説
AIプラクティショナー(AWS Certified AI Practitioner)
解説
このシナリオでは、顧客からのマルチモーダルクエリ(テキストと画像)に対して、迅速かつ正確な応答を提供する必要があります。なおかつ、コスト効率が求められています。
Amazon Rekognition
画像解析に特化したフルマネージドサービスであり、製品写真やスクリーンショットから必要な情報(例:ラベル、テキスト検出など)を低コストで抽出できます。
Amazon Bedrockの推論API(プロンプトエンジニアリング)
既存の基盤モデルに対して、抽出した画像情報とテキスト入力を統合したプロンプトを作成することで、チャットボットが文脈に応じた応答を生成できます。これにより、わざわざマルチモーダル対応の大規模なモデルのファインチューニングやゼロからのトレーニングを行う必要がなく、運用コストを抑えながら高精度な対応が可能となります。
B:正解。Rekognitionで画像情報を抽出し、テキスト情報と組み合わせることで、既存のBedrock推論APIを活用して効率的に応答を生成できます。複数のマネージドサービスを組み合わせることで、開発・運用コストを低減しながら要件を満たせます。
A:不正解。Amazon Bedrockの基盤モデルは既にマネージドサービスとして提供されていますが、現時点で直接テキストと画像の両方を同時に入力として扱えるファインチューニング機能は提供されていないか、実装に大きなコストがかかる可能性があります。
C:不正解。ゼロからマルチモーダルモデルをトレーニングする場合、開発期間、リソース、コストが大幅に増大するため、今回のコスト効率の要件には適していません。
D:不正解。Amazon Lex自体は主にテキストと音声に特化しており、画像解析機能は備わっていません。独自のロジックを開発する場合、追加開発コストや運用の複雑性が高まるため、コスト効率の面で劣ります。
Amazon Lex
Amazon Rekognition
Amazon SageMaker
Amazon Rekognition
画像解析に特化したフルマネージドサービスであり、製品写真やスクリーンショットから必要な情報(例:ラベル、テキスト検出など)を低コストで抽出できます。
Amazon Bedrockの推論API(プロンプトエンジニアリング)
既存の基盤モデルに対して、抽出した画像情報とテキスト入力を統合したプロンプトを作成することで、チャットボットが文脈に応じた応答を生成できます。これにより、わざわざマルチモーダル対応の大規模なモデルのファインチューニングやゼロからのトレーニングを行う必要がなく、運用コストを抑えながら高精度な対応が可能となります。
B:正解。Rekognitionで画像情報を抽出し、テキスト情報と組み合わせることで、既存のBedrock推論APIを活用して効率的に応答を生成できます。複数のマネージドサービスを組み合わせることで、開発・運用コストを低減しながら要件を満たせます。
A:不正解。Amazon Bedrockの基盤モデルは既にマネージドサービスとして提供されていますが、現時点で直接テキストと画像の両方を同時に入力として扱えるファインチューニング機能は提供されていないか、実装に大きなコストがかかる可能性があります。
C:不正解。ゼロからマルチモーダルモデルをトレーニングする場合、開発期間、リソース、コストが大幅に増大するため、今回のコスト効率の要件には適していません。
D:不正解。Amazon Lex自体は主にテキストと音声に特化しており、画像解析機能は備わっていません。独自のロジックを開発する場合、追加開発コストや運用の複雑性が高まるため、コスト効率の面で劣ります。
関連サービスの解説
Amazon BedrockAmazon Lex
Amazon Rekognition
Amazon SageMaker
+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 72%
No.46 解説
電子商取引会社が、顧客がテキスト説明と画像(例:製品写真や問題のスクリーンショット)を含むクエリを送信できるチャットボットの開発を進めています。チャットボットは、これらのマルチモーダル入力(テキストと画像情報)を理解し、シームレスに統合して、顧客のニーズに即した正確で文脈に沿った応答を提供することが求められています。
コスト効率を最大化しつつ、マルチモーダルクエリの処理を実現するために、最も適したアプローチはどれでしょうか?
- Amazon Bedrockのマルチモーダル対応基盤モデルを直接ファインチューニングして、テキストと画像を同時に入力できるチャットボットを構築する
- Amazon Rekognitionを使用して画像から必要な情報を抽出し、その抽出結果とテキスト入力を統合したプロンプトをAmazon Bedrockの推論APIに送信し、応答を生成する
- Amazon SageMakerで独自のマルチモーダルモデルをゼロからトレーニングし、チャットボットに組み込む
- Amazon Lexを利用してチャットボットを構築し、画像入力は事前に定義されたルールベースのロジックで処理する