AWS認定資格 WEB問題集&徹底解説

機械学習エンジニア–アソシエイト

正解 A問題
(お気に入りチェック) 1 2 3 4
解説
正解はAです。本問題の主要な要件は、MLワークフローのエンドツーエンドの自動化と、複数のモデル構成(アルゴリズム、特徴量セット)での実験結果を効率的に追跡・比較することです。

選択肢 A:Amazon SageMaker Pipelinesは、データ処理、モデルトレーニング、評価、デプロイメントを含むMLワークフロー全体をプログラムで定義し、自動化するためのサービスです。これにより、MLOpsのプラクティスを実装できます。Amazon SageMaker Experimentsは、ML実験の実行、追跡、比較、評価を可能にし、異なるハイパーパラメータ、アルゴリズム、データセットによるモデルの性能を効率的に比較して、最適なモデルを特定するのに役立ちます。この組み合わせは、提示されたすべての要件を最も効果的に満たします。

選択肢 B:Amazon SageMaker Feature Storeは、特徴量を一元的に管理し、再利用可能にするためのサービスであり、特徴量エンジニアリングプロセスの効率化には寄与しますが、MLワークフロー全体の自動化や実験結果の比較追跡を直接的に行うものではありません。Amazon SageMaker Autopilotは、データを基に最適なモデルを自動的に探索・構築しますが、開発者が複数のアルゴリズムや特徴量セットを明示的に「繰り返し実験し、結果を詳細に記録・比較する」という制御された実験管理のニーズには、SageMaker Experimentsの方が適しています。

選択肢 C:Amazon S3は学習データの格納に適していますが、それだけではMLワークフローの自動化にはなりません。ハイパーパラメータの調整を手動で行うことは、非効率的であり、多数の実験を比較検討するという要件を満たしません。Amazon SageMaker Training Jobsはモデル学習に利用されますが、ワークフローの自動化や実験の追跡・比較機能は提供しません。

選択肢 D:Amazon SageMaker Ground Truthは、機械学習モデルのトレーニングデータセットを作成するためのラベル付けサービスです。Amazon SageMaker Model Monitorは、デプロイされたMLモデルの性能を監視し、データドリフトやモデルドリフトを検出するために使用されます。これらはそれぞれデータ準備とモデル運用の重要なフェーズですが、MLワークフローの自動化や開発段階での実験追跡・比較という本問題の主要な要件には直接対応していません。

関連サービスの解説
Amazon SageMaker
Amazon Simple Storage Service (Amazon S3)

+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.15 解説
ある金融サービス企業は、顧客の信用リスク評価モデルを開発しています。データエンジニアリングチームは、データの前処理から特徴量エンジニアリング、モデルの学習、評価、デプロイメントに至る一連の機械学習(ML)ワークフローの自動化を目指しています。特に、モデルの精度を最大化するため、複数のアルゴリズムや異なる特徴量セットを組み合わせて繰り返し実験を行い、その結果を詳細に記録して比較検討する必要があります。これらの要件を最も効果的に満たすAWSソリューションは何ですか?
  • Amazon SageMaker Pipelinesを使用してワークフローを自動化し、Amazon SageMaker Experimentsを使用してモデルの実験結果を追跡および比較する。
  • Amazon SageMaker Feature Storeを使用して特徴量を管理し、Amazon SageMaker Autopilotを使用して最適なモデルを自動的に構築する。
  • Amazon S3に学習データを格納し、ハイパーパラメータの調整は手動で行い、Amazon SageMaker Training Jobsでモデルを学習させる。
  • Amazon SageMaker Ground Truthでデータセットにラベル付けを行い、Amazon SageMaker Model Monitorでモデルの性能を監視する。

(会員限定)当問題の評価をお願いします。改善に活用します。