Azure認定資格 WEB問題集&徹底解説
AI-900:Microsoft Azure AI Fundamentals
解説
正解はBです。このシナリオでは、ロボットアームが環境と相互作用しながら、報酬(成功)と罰則(不良品)のフィードバックを受け取り、試行錯誤を通じて最適な行動戦略を学習する必要があります。これは強化学習(Reinforcement Learning)の典型的なユースケースです。強化学習では、エージェント(ロボット)が環境内で行動を選択し、その結果得られる報酬を最大化するように学習します。Azure Machine Learning では強化学習のトレーニング環境を構築できます。
選択肢 A:教師あり学習の分類アプローチです。既存のラベル付きデータから不良品を識別することはできますが、最適な行動順序を試行錯誤で学習することはできません。事前に正解ラベルが必要なため、動的な最適化には適していません。
選択肢 C:教師あり学習の回帰アプローチです。過去データから将来の予測を行うことはできますが、ロボットが環境と相互作用しながら行動を改善していく学習プロセスには対応できません。
選択肢 D:教師なし学習のクラスタリングアプローチです。データのパターンをグループ化することはできますが、報酬に基づいた最適な行動戦略の学習には使用できません。
選択肢 A:教師あり学習の分類アプローチです。既存のラベル付きデータから不良品を識別することはできますが、最適な行動順序を試行錯誤で学習することはできません。事前に正解ラベルが必要なため、動的な最適化には適していません。
選択肢 C:教師あり学習の回帰アプローチです。過去データから将来の予測を行うことはできますが、ロボットが環境と相互作用しながら行動を改善していく学習プロセスには対応できません。
選択肢 D:教師なし学習のクラスタリングアプローチです。データのパターンをグループ化することはできますが、報酬に基づいた最適な行動戦略の学習には使用できません。
関連サービスの解説
Azure Machine Learning+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.37 解説
あなたの会社では、製造ラインで稼働する自律型ロボットアームのAIシステムを開発しています。このロボットアームは、複数の組み立て工程を最適な順序で実行し、不良品を最小化しながら作業速度を最大化する必要があります。ロボットは試行錯誤を通じて、報酬(成功した組み立て)と罰則(不良品の発生)に基づいて最適な動作パターンを習得する必要があります。このシナリオに最も適した機械学習アプローチはどれですか?
- 過去の不良品データにラベルを付けて分類モデルを構築する
- 試行と報酬のフィードバックに基づいて最適な行動方針を学習させる
- 過去の生産データから将来の不良品発生率を予測する回帰モデルを作成する
- ラベルなしの作業データから類似パターンをグループ化してクラスタリングする