AWS認定資格 WEB問題集&徹底解説

ソリューションアーキテクト – アソシエイト

Amazon AppFlow の概要と試験出題ポイントは?

AWSサービスの一つであるAmazon AppFlowはどんな内容なのでしょうか?また、AWS認定資格のソリューションアーキテクト-アソシエイト(SAA)に合格するためには、サービスのどんなポイントを押さえておけばよいのでしょうか?
ここでは、そんなあなたの疑問に回答していきたいと思います

Amazon AppFlow 徹底解説 | AWS認定試験の頻出ポイントまとめ

1. サービス概要

Amazon AppFlowは、Salesforce、ServiceNow、Zendesk、SlackなどのSaaSアプリケーションと、Amazon S3、Amazon Redshift、Snowflakeなどの分析基盤の間でデータを安全に転送するフルマネージド統合サービスです。 コードを書かずにフローを作成し、オンデマンド、スケジュール、イベントを契機にデータを移動できます。

試験では「SaaSデータをS3データレイクへ取り込みたい」「SalesforceのイベントをEventBridgeへ連携したい」「インターネットを避けてSaaSとAWS間のデータ転送を行いたい」という場面でAppFlowを選びます。 大規模ETLやSpark処理はAWS Glue、ストリーミング処理はKinesis/MSKと比較します。

2. 主な特徴と機能

2.1 ノーコードのSaaSデータ連携

AppFlowはコネクタを選び、送信元、送信先、フィールドマッピング、フィルター、実行条件を設定するだけでフローを作成できます。 Salesforceの商談、Zendeskのチケット、Slackの会話データなどをS3やRedshiftへ取り込めます。

2.2 フロー実行方式

フローはオンデマンド、スケジュール、イベントベースで実行できます。 定期的なデータレイク投入、日次集計、SaaSイベントの取り込みなど、同期頻度に合わせて設定します。

2.3 フィールドマッピングと変換

ソースと宛先のフィールドを対応付け、フィルター、マスク、検証、データ形式変換などを設定できます。 複雑なETLよりも、SaaSデータを安全に抽出・整形・ロードする用途に向きます。

2.4 PrivateLinkによるプライベート転送

対応するSaaS連携ではAWS PrivateLinkを使い、AWSネットワーク上でプライベートにデータを転送できます。 機密性の高いSaaSデータをインターネット経由で移動したくない場合に重要です。

2.5 Glue Data Catalogとパーティション

S3へ転送したデータをAWS Glue Data Catalogへカタログ化し、Athena、Redshift Spectrum、Glue、Lake Formationなどから発見・分析しやすくできます。 パーティションやファイル集約設定により、クエリ性能とコストを最適化します。

2.6 カスタムコネクタ

標準コネクタで対応できない社内API、オンプレミス、他クラウドサービスに対しては、Amazon AppFlow Custom Connector SDKを使って独自コネクタを構築できます。 ただし、試験では標準SaaS連携とAWS分析基盤への取り込みが中心です。

3. アーキテクチャおよび技術要素

  1. AppFlowでSalesforce、Zendesk、Slackなどの送信元コネクタを選択し、OAuthなどで接続プロファイルを作成する。
  2. S3、Redshift、Snowflake、EventBridgeなどの送信先を選択する。
  3. 対象オブジェクト、フィールド、フィルター、マッピング、変換、検証ルールを定義する。
  4. オンデマンド、スケジュール、イベントトリガーのいずれかでフローを実行する。
  5. 必要に応じてPrivateLink、KMS暗号化、Glue Data Catalog、S3パーティションを設定する。
  6. CloudWatch、CloudTrail、フロー実行履歴で転送成功、失敗、データ量、エラーを監視する。

AppFlowはSaaS連携をマネージド化しますが、データ品質、宛先スキーマ、増分取り込み、再実行、重複処理、個人情報の扱いは設計が必要です。

4. セキュリティと認証・認可

  • IAM最小権限: フロー作成、実行、接続プロファイル管理、S3/Redshift書き込み権限を用途別に制御する。
  • 接続プロファイル: SaaS認証情報やOAuth接続を安全に管理し、不要な接続は削除する。
  • 暗号化: 転送中と保存時の暗号化を使用し、必要に応じてAWS KMSカスタマー管理キーを指定する。
  • PrivateLink: 対応SaaSとのデータ転送をプライベートに行い、パブリックインターネット露出を減らす。
  • データ最小化: 必要なフィールドのみ転送し、PIIや機密データはマスキングやフィルターを検討する。
  • 監査: CloudTrailでAppFlow API操作を記録し、CloudWatchでフロー実行とエラーを監視する。

5. 料金形態

Amazon AppFlowは、フロー実行と転送・処理されるデータ量、連携先のAWSサービス利用料を中心に課金を考えます。

  • フロー実行: オンデマンド、スケジュール、イベントで実行されるフロー数を意識する。
  • データ処理量: 転送・処理されるデータ量が増えるほどコストに影響する。
  • 宛先サービス: S3、Redshift、EventBridge、Glue Data Catalog、CloudWatch Logsなどは各サービスで課金される。
  • ネットワーク: PrivateLinkやデータ転送の要件はリージョン、SaaS、通信経路ごとに確認する。
  • 最適化: 必要フィールドだけ抽出し、増分取り込み、パーティション、ファイル集約、不要フロー削除を行う。

6. よくあるアーキテクチャ・設計パターン

  • SaaS to S3データレイク: SalesforceやZendeskのデータをS3へ定期投入し、Glue Data CatalogとAthenaで分析する。
  • SaaS to Redshift分析: 営業、サポート、マーケティングデータをRedshiftへ集約し、BIで可視化する。
  • Salesforceイベント連携: Salesforce Platform EventsやChange Data CaptureをEventBridgeへ取り込み、LambdaやStep Functionsへルーティングする。
  • プライベートデータ転送: PrivateLinkを使い、機密データをAWSネットワーク内で転送する。
  • データカタログ化: S3に保存したSaaSデータをGlue Data Catalogへ登録し、Lake Formationでアクセス制御する。
  • カスタムSaaS連携: 標準コネクタがないAPI向けにCustom Connector SDKで拡張する。

7. 設定・デプロイ手順(ハンズオン例)

  1. AppFlowコンソールで新しいフローを作成し、送信元SaaSコネクタを選択する。
  2. OAuthなどで接続プロファイルを作成し、対象オブジェクトや取得条件を選ぶ。
  3. S3、Redshift、EventBridgeなどの送信先を指定し、必要なIAM権限とKMSキーを設定する。
  4. フィールドマッピング、フィルター、変換、検証、エラー処理を設定する。
  5. オンデマンド、スケジュール、イベントトリガーの実行方式を選択する。
  6. S3宛先ではファイル形式、集約、パーティション、Glue Data Catalog登録を設定する。
  7. フローを実行し、実行履歴、CloudWatch、CloudTrail、宛先データを確認する。

8. 試験で問われやすいポイント

8.1 サービス選択

  • Q: Amazon AppFlowの主な用途は?
    A: SaaSアプリケーションとAWSサービス間でデータを安全に転送・同期すること。
  • Q: SalesforceデータをコードなしでS3データレイクに取り込みたい場合のサービスは?
    A: Amazon AppFlow。
  • Q: 大規模なETL変換やSparkジョブを実行する代表サービスは?
    A: AWS Glue。AppFlowはSaaS連携とデータ転送が中心。

8.2 実行方式と連携

  • Q: AppFlowのフロー実行方式は?
    A: オンデマンド、スケジュール、イベントベース。
  • Q: SalesforceイベントをAWSサービスへルーティングしたい場合に連携するサービスは?
    A: Amazon EventBridge。
  • Q: S3に転送したデータをAthenaで発見しやすくするには?
    A: AWS Glue Data Catalogへのカタログ化とパーティション設定を使う。

8.3 セキュリティと料金

  • Q: AppFlowでインターネットを避けたSaaSデータ転送に使う機能は?
    A: AWS PrivateLinkを利用したプライベートデータ転送。
  • Q: AppFlowの主なセキュリティ対策は?
    A: IAM、KMS暗号化、接続プロファイル管理、PrivateLink、CloudTrail監査。
  • Q: AppFlowの主な課金要素は?
    A: フロー実行、転送・処理データ量、宛先や監視に使うAWSサービスの利用料。