AWS認定資格 WEB問題集&徹底解説
機械学習エンジニア–アソシエイト
解説
正解はBとCです。SageMaker Data Wranglerは、機械学習モデルのためのデータ準備を効率化するために設計されています。
選択肢 B:SageMaker Data Wranglerには、タイムスタンプ形式の列から「曜日」「時間帯」「月の週」といった、より意味のある派生特徴量を簡単に抽出・生成できる多様なデータ変換オプションが用意されています。これは、時系列データから新しい特徴量をエンジニアリングするという要件に直接対応します。
選択肢 C:SageMaker Data WranglerのQuick Model機能は、データセットを基に迅速にモデルを構築し、各特徴量の重要度を自動的に計算して表示します。これにより、生成された新しい特徴量を含む、データセット内の全ての特徴量が予測モデルにどの程度寄与しているかを評価し、重要な特徴量を特定できます。
選択肢 A:SageMaker Data Wranglerの主な目的はデータ準備であり、データセットから直接時系列予測モデルを構築してトレンドを予測する機能は提供していません。これはSageMaker Canvasや他のSageMakerのモデル構築機能で行うべきタスクです。
選択肢 D:SageMaker Data WranglerはAmazon RedshiftやAmazon RDSなどの様々なデータソースからデータをインポートできますが、その主な役割はデータ準備と変換です。リアルタイムでデータを統合し、直接推論エンドポイントに供給する機能は、通常、AWS GlueやAWS Lambda、Amazon Kinesis Data Streams、Amazon SageMaker Feature Storeなどと連携して実現されるアーキテクチャの一部であり、Data Wrangler単独の主要な機能ではありません。
選択肢 B:SageMaker Data Wranglerには、タイムスタンプ形式の列から「曜日」「時間帯」「月の週」といった、より意味のある派生特徴量を簡単に抽出・生成できる多様なデータ変換オプションが用意されています。これは、時系列データから新しい特徴量をエンジニアリングするという要件に直接対応します。
選択肢 C:SageMaker Data WranglerのQuick Model機能は、データセットを基に迅速にモデルを構築し、各特徴量の重要度を自動的に計算して表示します。これにより、生成された新しい特徴量を含む、データセット内の全ての特徴量が予測モデルにどの程度寄与しているかを評価し、重要な特徴量を特定できます。
選択肢 A:SageMaker Data Wranglerの主な目的はデータ準備であり、データセットから直接時系列予測モデルを構築してトレンドを予測する機能は提供していません。これはSageMaker Canvasや他のSageMakerのモデル構築機能で行うべきタスクです。
選択肢 D:SageMaker Data WranglerはAmazon RedshiftやAmazon RDSなどの様々なデータソースからデータをインポートできますが、その主な役割はデータ準備と変換です。リアルタイムでデータを統合し、直接推論エンドポイントに供給する機能は、通常、AWS GlueやAWS Lambda、Amazon Kinesis Data Streams、Amazon SageMaker Feature Storeなどと連携して実現されるアーキテクチャの一部であり、Data Wrangler単独の主要な機能ではありません。
関連サービスの解説
Amazon SageMaker+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.13 解説
ある機械学習チームは、顧客のライフサイクルにおける特定のイベント発生を予測するモデルを構築しています。このモデルの精度を高めるため、チームは時系列情報を含む大規模なデータセットの準備に着手しました。
課題:チームは、データセット内のタイムスタンプ列から「月の週」や「特定の時間帯」といった、より高レベルの新しい特徴量を生成したいと考えています。さらに、生成されたこれらの新しい特徴量と既存の特徴量が、予測モデルに対してどの程度の寄与度を持つのかを評価し、重要な特徴量を特定する必要があります。
解決策:データ準備プロセスを効率化するため、チームはAmazon SageMaker Data Wranglerの活用を決定しました。この要件を達成するために、SageMaker Data WranglerのどのTWO機能が特に役立ちますか? (2つ選択してください)
- データセットから直接、時系列予測モデルを構築し、将来のイベント発生トレンドを自動的に予測する機能。
- タイムスタンプデータから「曜日」「時間帯」「月の週」などの派生特徴量を自動的に生成するデータ変換機能。
- Quick Model機能を利用して、生成された特徴量の予測モデルに対する重要度を自動的に算出し、ランキング表示する機能。
- Amazon RedshiftやAmazon RDSなどの複数のデータソースからデータをリアルタイムで統合し、推論エンドポイントに直接供給する機能。