AWS認定資格 WEB問題集&徹底解説

機械学習エンジニア–アソシエイト

正解 C問題
(お気に入りチェック) 1 2 3 4
解説
正解はCです。問題文にある「モデルの訓練時に使用したデータセットと、現在推論に用いられている入力データセットの統計的特性に乖離が生じていないか」を監視するという要件は、まさにデータドリフト(データ分布ドリフト)の検出を目的としています。データドリフトは、モデルの入力データの統計的特性が時間の経過とともに変化する現象であり、多くの場合、モデルのパフォーマンス低下の先行指標となります。Amazon SageMaker Model Monitorはこの種のドリフトを自動的に検出する機能を提供します。

選択肢 A:特徴量属性ドリフトは、モデルの出力に対する各入力特徴量の相対的な重要度や影響が時間とともに変化する現象を指します。これはデータの変化そのものより、モデルの振る舞いや解釈可能性の変化に関連します。

選択肢 B:モデルパフォーマンスドリフトは、モデルの予測精度、F1スコア、MAEなどの具体的なパフォーマンス指標が時間とともに低下する現象を指します。データ分布の乖離(データドリフト)はモデルパフォーマンスドリフトの原因となることが多いですが、直接監視する対象はデータの統計的特性の変化そのものです。

選択肢 D:公平性ドリフトは、モデルの予測における公平性(特定の属性グループに対する差別的な予測など)が時間とともに変化する現象を指します。これは、モデルの倫理的側面や社会的な影響に関連するものであり、入力データの統計的特性の変化とは異なる観点です。

関連サービスの解説
Amazon CloudWatch
Amazon SageMaker

+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 0%
No.2 解説
ある企業は、顧客の行動予測を行う機械学習モデルをAmazon SageMakerで本番運用しています。運用開始から数ヶ月が経過し、モデルの予測パフォーマンス維持が重要な課題となっています。特に、モデルの訓練時に使用したデータセットと、現在推論に用いられている入力データセットの統計的特性に乖離が生じていないかを継続的に把握したいと考えています。この状況で、データサイエンティストがまず監視すべき最も適切なドリフトタイプは何ですか。
  • 特徴量属性ドリフト
  • モデルパフォーマンスドリフト
  • データ分布ドリフト
  • 公平性ドリフト

(会員限定)当問題の評価をお願いします。改善に活用します。