AWS認定資格 WEB問題集&徹底解説

クラウドプラクティショナー

AWS Glue の概要と試験出題ポイントは?

AWSサービスの一つであるAWS Glueはどんな内容なのでしょうか?また、AWS認定資格のクラウドプラクティショナー(CLF)に合格するためには、サービスのどんなポイントを押さえておけばよいのでしょうか?
ここでは、そんなあなたの疑問に回答していきたいと思います

AWS Glue の概要

AWS Glueは、データの抽出、変換、ロード(ETL)プロセスを簡単に作成、実行、管理できるフルマネージド型のサービスで、データウェアハウスへのデータ移行やデータ分析アプリケーションの補助を行います。Glueは、分散データ処理フレームワークのApache Sparkを採用しており、スクリプトやジョブを作成して、あらゆる種類のデータ間の相互変換、結合、圧縮を行うことができます。

AWS Glue の出題ポイント

以下は、受験にあたって理解しておくべき出題ポイントです。

分類 内容
AWS Glueの主要コンポーネント データカタログ、ETLジョブ、開発エンドポイントが主要なコンポーネントであり、データの設計、分析、実行のプロセスをサポートします。
データカタログ AWS Glue Data Catalogは、中央リポジトリであり、データソースや処理されたデータを管理、検索、共有できる機能を提供します。データカタログは、Apache Hive Metastoreと互換性があります。
GLUEクローラ AWS Glueクローラは、データソースからスキーマを自動的に検出し、テーブルを作成する機能を持っています。クローラがデータソースをスキャンし、スキーマ情報をデータカタログに追加します。
ETLジョブ AWS Glue ETLジョブは、データの抽出、変換、ロードプロセスを管理するための機能です。ジョブは、PythonまたはScalaのスクリプトで記述され、Apache Sparkに基づいて実行されます。
開発エンドポイント 開発エンドポイントは、ETLスクリプト開発のためのノートブック環境を提供し、テストやデバッグが容易になります。開発エンドポイントは、ZeppelinノートブックやJupyterノートブックと統合できます。
統合サービス AWS Glueは、他のAWSサービス(Amazon S3、Amazon RDS、Amazon Redshiftなど)と統合されており、データソースやターゲットとして使用できます。また、AWS LambdaやAWS Step Functionsとの統合により、各種イベントやワークフロー管理が可能です。

コメント

当サービスに関連して、覚えておいた方がよいポイントなどありましたら、お気軽にコメントください。教え学び合える場になれば嬉しいです。