AWS認定資格 WEB問題集&徹底解説
クラウドプラクティショナー
AWS Glue の概要と試験出題ポイントは?
AWSサービスの一つであるAWS Glueはどんな内容なのでしょうか?また、AWS認定資格のクラウドプラクティショナー(CLF)に合格するためには、サービスのどんなポイントを押さえておけばよいのでしょうか?
ここでは、そんなあなたの疑問に回答していきたいと思います
AWS Glue の概要
AWS Glueは、データの抽出、変換、ロード(ETL)プロセスを簡単に作成、実行、管理できるフルマネージド型のサービスで、データウェアハウスへのデータ移行やデータ分析アプリケーションの補助を行います。Glueは、分散データ処理フレームワークのApache Sparkを採用しており、スクリプトやジョブを作成して、あらゆる種類のデータ間の相互変換、結合、圧縮を行うことができます。
広告
AWS Glue の出題ポイント
以下は、受験にあたって理解しておくべき出題ポイントです。
分類 | 内容 |
---|---|
AWS Glueの主要コンポーネント | データカタログ、ETLジョブ、開発エンドポイントが主要なコンポーネントであり、データの設計、分析、実行のプロセスをサポートします。 |
データカタログ | AWS Glue Data Catalogは、中央リポジトリであり、データソースや処理されたデータを管理、検索、共有できる機能を提供します。データカタログは、Apache Hive Metastoreと互換性があります。 |
GLUEクローラ | AWS Glueクローラは、データソースからスキーマを自動的に検出し、テーブルを作成する機能を持っています。クローラがデータソースをスキャンし、スキーマ情報をデータカタログに追加します。 |
ETLジョブ | AWS Glue ETLジョブは、データの抽出、変換、ロードプロセスを管理するための機能です。ジョブは、PythonまたはScalaのスクリプトで記述され、Apache Sparkに基づいて実行されます。 |
開発エンドポイント | 開発エンドポイントは、ETLスクリプト開発のためのノートブック環境を提供し、テストやデバッグが容易になります。開発エンドポイントは、ZeppelinノートブックやJupyterノートブックと統合できます。 |
統合サービス | AWS Glueは、他のAWSサービス(Amazon S3、Amazon RDS、Amazon Redshiftなど)と統合されており、データソースやターゲットとして使用できます。また、AWS LambdaやAWS Step Functionsとの統合により、各種イベントやワークフロー管理が可能です。 |
コメント
当サービスに関連して、覚えておいた方がよいポイントなどありましたら、お気軽にコメントください。教え学び合える場になれば嬉しいです。
広告