Azure認定資格 WEB問題集&徹底解説
AI-900:Microsoft Azure AI Fundamentals
解説
正解はAです。Overfitting(過学習)は、モデルがトレーニングデータの詳細やノイズまで記憶してしまい、新しいデータに対する汎化能力が低下する現象です。トレーニングデータでは高精度を示す一方、検証データや本番データでは性能が大幅に低下するという特徴があります。Azure Machine Learningでは、正則化、Early Stopping、Cross-Validation、Dropoutなどの手法でOverfittingを防止します。
選択肢 B:Underfittingは、モデルの表現力が不足しており、トレーニングデータに対しても十分な精度が得られない状態を指します。問題文では「トレーニングデータに対しては高い精度を示す」と記載されているため、Underfittingには該当しません。
選択肢 C:Data Leakageは、トレーニングプロセスに本来使用すべきでない情報(テストデータの情報など)が混入してしまう問題です。モデルの汎化性能低下の原因ではなく、不適切なデータ分割や特徴量エンジニアリングに起因する別の問題です。
選択肢 D:Class Imbalanceは、分類問題において各クラスのサンプル数に大きな偏りがある状態を指します。これは予測精度に影響を与える可能性がありますが、トレーニングデータでのみ高精度になるという過学習の特徴とは異なる概念です。
Azure Machine Learning
選択肢 B:Underfittingは、モデルの表現力が不足しており、トレーニングデータに対しても十分な精度が得られない状態を指します。問題文では「トレーニングデータに対しては高い精度を示す」と記載されているため、Underfittingには該当しません。
選択肢 C:Data Leakageは、トレーニングプロセスに本来使用すべきでない情報(テストデータの情報など)が混入してしまう問題です。モデルの汎化性能低下の原因ではなく、不適切なデータ分割や特徴量エンジニアリングに起因する別の問題です。
選択肢 D:Class Imbalanceは、分類問題において各クラスのサンプル数に大きな偏りがある状態を指します。これは予測精度に影響を与える可能性がありますが、トレーニングデータでのみ高精度になるという過学習の特徴とは異なる概念です。
関連サービスの解説
Machine Learning ServiceAzure Machine Learning
+ 質問 / コメント
解答・解説に疑問がある場合や、よりよい解説がある場合など、お気軽にコメントください。ただし、短文コメントは表示されません。また、中傷などコメントの内容によっては、会員機能を停止させて頂きます。教え学び合える場になれば嬉しいです。(コメント投稿にはログインが必要です)
正答率 %
No.11 解説
機械学習モデルの開発において、トレーニングデータに対しては高い精度を示すものの、検証データや本番環境の新しいデータに対しては予測性能が著しく低下する現象が発生しています。この現象は、モデルがトレーニングデータの特徴やノイズを過度に学習してしまい、汎化性能が失われたことが原因です。
この現象を表す適切な用語を選択してください。
この現象を表す適切な用語を選択してください。
- Overfitting(過学習)
- Underfitting(学習不足)
- Data Leakage(データ漏洩)
- Class Imbalance(クラス不均衡)