AWS認定資格 WEB問題集&徹底解説

機械学習エンジニア–アソシエイト

正解 A問題
(お気に入りチェック) 1 2 3 4
解説
正解はAです。CLV予測のベースラインモデルを構築する目的は、シンプルで解釈が容易であり、将来的に導入する高度なモデルと比較するための初期ベンチマークを提供することです。Amazon SageMakerの組み込みアルゴリズムである線形学習器(Linear Learner)は、このような要件に最適な選択肢です。線形学習器は実装が簡単で、主要な構造化データ(購買履歴、平均購入金額など)に基づいて効率的に回帰モデルを構築できます。これにより、複雑な深層学習モデルをデプロイする前に、堅牢で理解しやすい初期パフォーマンス基準を確立できます。

選択肢B:Amazon SageMaker Autopilotは、自動的に最適なモデルとハイパーパラメータを探索・選択する強力なAutoMLサービスですが、これは「シンプルで解釈が容易なベースラインモデル」という要件に対しては過剰なアプローチです。Autopilotが生成するモデルは複雑になる可能性があり、ベースラインとしてその後の高度なモデルとの比較を目的とする場合、ベースライン自体が高度なモデルであると適切な比較が難しくなることがあります。

選択肢C:Amazon SageMaker JumpStartは事前学習済みモデルを容易にデプロイできるサービスですが、顧客セグメンテーション用のモデルは分類またはクラスタリングタスクであり、CLV予測(回帰タスク)とは目的が異なります。また、事前学習済みモデルは必ずしもシンプルではなく、特定のデータセットに最適化されていない可能性もあるため、CLV予測の直接的なベースラインとしては不適切です。

選択肢D:Amazon SageMaker BlazingTextモデルはテキストデータからワードエンベディングを生成するのに適したアルゴリズムです。顧客レビューからの特徴量生成は、追加の特徴量としてCLV予測に貢献する可能性はありますが、それ自体がCLV予測の「ベースラインモデル」を構築する主要なアプローチではありません。CLV予測は主に顧客の購買行動などの構造化データに基づいて行われることが多く、BlazingTextによるテキスト処理を導入することは、ベースラインとして求める「シンプルさ」と「容易な実装」から逸脱し、不必要な複雑さを追加することになります。

関連サービスの解説
Amazon SageMaker

+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.19 解説
あるデータサイエンティストは、オンライン小売企業における顧客生涯価値(CLV)を予測する機械学習プロジェクトに取り組んでいます。このプロジェクトでは、後にデプロイを検討している高度な深層学習モデルのパフォーマンスを評価するための比較基準として、信頼性の高いベースラインモデルを確立する必要があります。大規模なデータセットと計算リソースを効率的に活用しつつ、Amazon SageMaker上で、シンプルで解釈が容易なモデルを構築し、CLV予測の初期パフォーマンスベンチマークとして機能させるには、どのようなアプローチが最も適切でしょうか。
  • Amazon SageMakerの組み込みアルゴリズムである線形学習器モデルを選択し、顧客の購買履歴、平均購入金額、初回購入からの経過日数といった主要な構造化データに基づいてCLV予測のベースラインを構築する。
  • Amazon SageMaker Autopilotを活用し、自動で最適なモデルやハイパーパラメータを探索させ、最も性能の良いモデルをCLV予測のベースラインとして採用する。
  • Amazon SageMaker JumpStartを利用して、既存の顧客属性データに基づいたセグメンテーション用の事前学習済みモデルをデプロイし、その結果をCLV予測のベースラインとして用いる。
  • Amazon SageMaker BlazingTextモデルを用いて顧客レビューから特徴ベクトルを生成し、これをCLV予測のベースラインモデルの主要な入力特徴量として利用する。

(会員限定)当問題の評価をお願いします。改善に活用します。