AWS認定資格 WEB問題集&徹底解説
機械学習エンジニア–アソシエイト
解説
正解はBです。Amazon SageMakerエンドポイントのオートスケーリング機能を有効にすると、トラフィックの負荷に応じてインスタンス数を自動的に増減させることができます。これにより、高トラフィック時のパフォーマンス問題(レイテンシの増加やタイムアウト)を解決し、低トラフィック時にはインスタンス数を減らしてコストを最適化できます。特にターゲット使用率に基づくスケーリングは、パフォーマンスを維持しつつコストを管理する効果的な方法です。AWS Budgetsで予測コストアラートを設定することで、コストが予算を超過するリスクを事前に検知し、適切な対策を講じることが可能になり、コスト効率の要件も満たします。
選択肢 A:サービスクォータの引き上げは、より多くのインスタンスを起動できるようになるための前提条件ですが、それ自体は需要に応じた動的なリソース調整を行うものではありません。CloudWatchアラームは監視と通知の機能であり、自動的に容量を調整してパフォーマンス問題を解決するものではないため、低レイテンシ要件やリアルタイムのトラフィック変動への対応としては不十分です。手動での介入が必要となり、迅速な対応ができません。
選択肢 C:SageMakerエンドポイントのインスタンスタイプをより高性能なものに変更することは、単一インスタンスあたりの処理能力を向上させますが、ピーク時以外のアイドル時にも高コストが発生し、コスト効率が悪くなる可能性があります。また、単一インスタンスの性能向上には限界があり、大規模なトラフィック急増に柔軟に対応できない場合があります。手動でのモニタリングと調整は、リアルタイムのトラフィック変動に迅速に対応することが難しく、運用負荷も高くなります。
選択肢 D:推論サービスをAmazon API GatewayとAWS Lambdaに完全に移行することは、現在のSageMakerエンドポイントの課題に対する直接的な解決策ではなく、大幅なアーキテクチャ変更を伴います。SageMakerは機械学習モデルのデプロイ、ホスティング、スケーリングに特化しており、ML推論ワークロードに最適化されています。Lambdaは汎用的なコンピューティングサービスであり、モデルのサイズや推論の複雑さによっては、パフォーマンスやコスト効率がSageMakerより劣る可能性があります。また、SageMakerで得られるML特有の監視や管理機能も失われる可能性があります。
Amazon CloudWatch
Amazon SageMaker
AWS Budgets
AWS Lambda
選択肢 A:サービスクォータの引き上げは、より多くのインスタンスを起動できるようになるための前提条件ですが、それ自体は需要に応じた動的なリソース調整を行うものではありません。CloudWatchアラームは監視と通知の機能であり、自動的に容量を調整してパフォーマンス問題を解決するものではないため、低レイテンシ要件やリアルタイムのトラフィック変動への対応としては不十分です。手動での介入が必要となり、迅速な対応ができません。
選択肢 C:SageMakerエンドポイントのインスタンスタイプをより高性能なものに変更することは、単一インスタンスあたりの処理能力を向上させますが、ピーク時以外のアイドル時にも高コストが発生し、コスト効率が悪くなる可能性があります。また、単一インスタンスの性能向上には限界があり、大規模なトラフィック急増に柔軟に対応できない場合があります。手動でのモニタリングと調整は、リアルタイムのトラフィック変動に迅速に対応することが難しく、運用負荷も高くなります。
選択肢 D:推論サービスをAmazon API GatewayとAWS Lambdaに完全に移行することは、現在のSageMakerエンドポイントの課題に対する直接的な解決策ではなく、大幅なアーキテクチャ変更を伴います。SageMakerは機械学習モデルのデプロイ、ホスティング、スケーリングに特化しており、ML推論ワークロードに最適化されています。Lambdaは汎用的なコンピューティングサービスであり、モデルのサイズや推論の複雑さによっては、パフォーマンスやコスト効率がSageMakerより劣る可能性があります。また、SageMakerで得られるML特有の監視や管理機能も失われる可能性があります。
関連サービスの解説
Amazon API GatewayAmazon CloudWatch
Amazon SageMaker
AWS Budgets
AWS Lambda
+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.5 解説
ヘルスケア分野のスタートアップ企業は、患者データに基づいてリアルタイム診断を提供するサービスを運用しています。このサービスは、Amazon SageMakerにデプロイされた機械学習モデルの推論エンドポイントを使用しており、低レイテンシで大量のリクエストを処理する必要があります。最近の急速な利用者増加により、トラフィックが急増する時間帯にエンドポイントのレスポンスが遅延し、一部のリクエストでタイムアウトが発生するようになりました。企業は運用コストを抑制しつつ、この容量問題を解決する必要があります。パフォーマンス要件とコスト効率のバランスを最も効果的に実現するアプローチとして、適切なものはどれですか。
- SageMakerエンドポイントのサービスクォータを上限まで引き上げ、CloudWatchアラームを設定してCPU使用率が90%を超過した際に通知を受け取るようにする。
- SageMakerエンドポイントのオートスケーリング機能を有効にし、ターゲット使用率に基づいてインスタンス数を自動調整する。同時に、AWS Budgetsで予測コストアラートを設定し、予算超過を事前に把握する。
- SageMakerエンドポイントのインスタンスタイプをより高性能なものへ変更し、単一インスタンスあたりの処理能力を向上させる。コストとパフォーマンスの状況はAmazon CloudWatchのメトリクスを定期的に確認し、必要に応じて手動で調整する。
- 推論サービスをAmazon API GatewayとAWS Lambdaの構成へ完全に移行し、Lambdaのプロビジョンドコンカレンシーを使用してコールドスタートを回避する。Lambdaの最大同時実行数を制限してコストを管理する。