AWS認定資格 WEB問題集&徹底解説

機械学習エンジニア–アソシエイト

正解 D問題
(お気に入りチェック) 1 2 3 4
解説
正解はDです。強化学習問題を定式化する上での基本的な構成要素は、エージェント(学習し行動する主体)、環境(エージェントが相互作用する世界)、アクション(エージェントが環境に対して実行できる行動)、そして報酬(エージェントの行動に対するフィードバック)です。これらを明確に定義することで、エージェントが環境内で試行錯誤し、報酬を最大化する最適な行動戦略を学習するための枠組みが確立されます。

選択肢 A:静的なルールセットは、事前に定義されたロジックに基づいて動作するため、強化学習が目指す「環境からの学習と適応」とは根本的に異なるアプローチです。強化学習は、環境との相互作用を通じて最適な行動を自律的に探索し、改善します。

選択肢 B:手動でのデータラベリングは、主に教師あり学習で使用される手法です。強化学習では、明示的なラベル付けされたデータではなく、環境から得られる報酬信号が学習のフィードバックとして機能します。

選択肢 C:教師あり学習は、入力データとそれに対応する正解ラベルのペアを用いてモデルを訓練する手法です。強化学習は、エージェントが環境との相互作用を通じて報酬を最大化する行動を学習するプロセスであり、教師あり学習とは目的もアプローチも異なります。

関連サービスの解説
Amazon SageMaker

+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.18 解説
ある投資会社は、変動の激しい金融市場において、リアルタイムで最適な取引判断を下すための高度なAIシステム導入を検討しています。従来の統計モデルや固定的なルールベースのシステムでは対応が難しい市場の動的な変化に適応する能力を持つモデルを求めています。同社は、Amazon SageMakerの強化学習機能を利用し、仮想的な取引環境でエージェントを訓練し、利益を最大化する戦略を開発することを決定しました。この強化学習アプローチを適切に設計し、エージェントが効果的に学習を開始できるようにするためには、プロジェクトの初期段階でどのような要素を明確に定義する必要があるでしょうか。
  • 市場の特定イベント発生時に適用される、厳格な取引ロジックの静的ルールセットを構築する
  • 過去の取引データから、成功した取引と失敗した取引を手動で分類し、詳細なラベルを付与する
  • 大量の歴史的市場データを収集し、それを用いて将来の株価変動を予測する教師あり学習モデルを訓練する
  • 取引を行うエージェント、市場のシミュレーション環境、エージェントが実行可能なアクション、および取引結果に基づく報酬をそれぞれ定義する

(会員限定)当問題の評価をお願いします。改善に活用します。