AWS認定資格 WEB問題集&徹底解説
機械学習エンジニア–アソシエイト
解説
正解はAです。Amazon SageMaker Data Wranglerは、機械学習のためのデータ準備を簡素化するサービスです。データソースへの接続、データの選択、変換、特徴量エンジニアリング、品質検証、視覚化といった一連のプロセスを、コーディングを最小限に抑えた単一の視覚的インターフェースで実行できます。問題文にある「欠損値の補完、外れ値の除去、特徴量エンジニアリング」「異なるデータソースからの結合」「データ品質の検証と視覚的な探索」「コーディング量を最小限に抑え、直感的で視覚的なインターフェースを通じて統合された環境」という要件に完全に合致します。
選択肢 B:Amazon SageMaker Feature Storeは、機械学習モデルのトレーニングと推論のために特徴量を保存、共有、再利用するためのマネージドサービスです。データ準備の「結果」である特徴量を管理するものであり、データ準備「そのもの」を行うための視覚的インターフェースを提供するサービスではありません。
選択肢 C:Amazon SageMaker Clarifyは、機械学習モデルの公平性と説明可能性を評価するためのサービスです。モデルのバイアスを検出し、予測の理由を説明するのに役立ちますが、データの前処理、クレンジング、探索、可視化といった作業には直接関与しません。
選択肢 D:Amazon SageMaker Studioは、機械学習開発の統合開発環境(IDE)であり、ノートブックベースでコーディングによるデータ準備が可能です。しかし、「コーディング量を最小限に抑え、直感的で視覚的なインターフェース」という問題文の要件に対しては、Data Wranglerがより特化しており、ベストフィットな選択肢となります。Studio内でData Wranglerを利用することもできますが、問題の意図はデータ準備機能そのものに焦点を当てています。
Amazon Simple Storage Service (Amazon S3)
選択肢 B:Amazon SageMaker Feature Storeは、機械学習モデルのトレーニングと推論のために特徴量を保存、共有、再利用するためのマネージドサービスです。データ準備の「結果」である特徴量を管理するものであり、データ準備「そのもの」を行うための視覚的インターフェースを提供するサービスではありません。
選択肢 C:Amazon SageMaker Clarifyは、機械学習モデルの公平性と説明可能性を評価するためのサービスです。モデルのバイアスを検出し、予測の理由を説明するのに役立ちますが、データの前処理、クレンジング、探索、可視化といった作業には直接関与しません。
選択肢 D:Amazon SageMaker Studioは、機械学習開発の統合開発環境(IDE)であり、ノートブックベースでコーディングによるデータ準備が可能です。しかし、「コーディング量を最小限に抑え、直感的で視覚的なインターフェース」という問題文の要件に対しては、Data Wranglerがより特化しており、ベストフィットな選択肢となります。Studio内でData Wranglerを利用することもできますが、問題の意図はデータ準備機能そのものに焦点を当てています。
関連サービスの解説
Amazon SageMakerAmazon Simple Storage Service (Amazon S3)
+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.10 解説
ある製造企業は、機器の予知保全を目的として、センサーデータやメンテナンス履歴を含む数十テラバイト規模の時系列データをAmazon S3にCSV形式で保存しています。このデータは数億行に達することもあります。機械学習モデルのトレーニングに先立ち、データサイエンティストは以下の前処理を効率的に実行する必要があります。
- 欠損値の補完、外れ値の除去、特徴量エンジニアリング(例:移動平均の計算)
- 異なるデータソースからの結合
- データ品質の検証と視覚的な探索
- Amazon SageMaker Data Wrangler
- Amazon SageMaker Feature Store
- Amazon SageMaker Clarify
- Amazon SageMaker Studio