AWS認定資格 WEB問題集&徹底解説

AIプラクティショナー

Amazon Translate の概要と試験出題ポイントは?

AWSサービスの一つであるAmazon Translateはどんな内容なのでしょうか?また、AWS認定資格のAIプラクティショナー(AIF)に合格するためには、サービスのどんなポイントを押さえておけばよいのでしょうか?
ここでは、そんなあなたの疑問に回答していきたいと思います

Amazon Translate 徹底解説 | AWS認定試験の頻出ポイントまとめ

1. サービス概要

Amazon Translateは、高度な機械学習を使ってテキストや文書をオンデマンドで翻訳するフルマネージドのニューラル機械翻訳サービスです。 アプリケーションの多言語化、カスタマーサポート、チャット、ナレッジベース、SNS分析、文書リポジトリ翻訳などに利用できます。

試験では、Translateは「テキスト翻訳」、Pollyは「テキスト読み上げ」、Transcribeは「音声文字起こし」、Comprehendは「テキスト分析」と切り分けます。 少量テキストはリアルタイムAPI、大量ファイルはS3を使う非同期バッチ翻訳、用語統一はCustom Terminology、並訳データによる品質改善はActive Custom Translationを検討します。

2. 主な特徴と機能

2.1 リアルタイム翻訳

TranslateText APIにソース言語、ターゲット言語、テキストを渡すと即時に翻訳結果を返します。 Webアプリ、チャット、問い合わせフォーム、短文メッセージなど、低レイテンシが必要な用途に向きます。

2.2 非同期バッチ翻訳

StartTextTranslationJobは、S3に保存した多数の文書を一括翻訳し、結果をS3へ出力します。 ドキュメントリポジトリ、ナレッジベース、製品マニュアルなど、大量ファイルの翻訳ではバッチ処理を選択します。

2.3 Custom Terminology

Custom Terminologyは、ブランド名、製品名、専門用語、人名などを指定した訳語で統一する辞書機能です。 標準モデルの翻訳を用語レベルで制御したい場合に使い、企業文書やサポート文書の一貫性を高めます。

2.4 Active Custom Translation

Active Custom Translationは、並訳データ(parallel data)を使ってドメインに合った翻訳品質を高める機能です。 用語の固定だけでなく、文体や業界特有の表現に寄せたい場合に検討します。

2.5 自動言語検出と文書翻訳

ソース言語を自動判定して翻訳でき、テキストだけでなく対応形式の文書翻訳にも利用できます。 ただし、フォームや表の抽出が目的ならTextract、文書の分類や感情分析が目的ならComprehendを組み合わせます。

2.6 他AWSサービス連携

Lambda、Step Functions、Glue、S3、DynamoDB、Aurora、Redshift、Comprehend、Transcribe、Pollyと組み合わせ、多言語処理パイプラインを構築できます。 例えばTranscribeで字幕を作り、Translateで翻訳し、Pollyで多言語音声を生成できます。

3. アーキテクチャおよび技術要素

  1. リアルタイム用途では、アプリケーションがTranslateText APIを呼び出し、翻訳結果をUIや後続処理へ渡す。
  2. 大量文書では、入力ファイルをS3に配置し、StartTextTranslationJobで非同期翻訳を開始する。
  3. 専門用語を統一する場合はCustom Terminologyを登録し、API呼び出しやバッチジョブに関連付ける。
  4. ドメイン翻訳品質を高める場合はparallel dataを用意し、Active Custom Translationを利用する。
  5. 結果をS3、DynamoDB、OpenSearch Service、Redshift、Auroraなどに保存し、検索・分析・配信へ連携する。
  6. IAM、KMS、CloudTrail、VPCエンドポイントでアクセス制御、暗号化、監査を行う。

サーバーレス構成では、S3イベントやEventBridgeをトリガーにLambda/Step Functionsで翻訳ジョブを起動し、完了後に通知・インデックス登録を行います。

4. セキュリティと認証・認可

  • IAM最小権限: translate:TranslateTexttranslate:StartTextTranslationJob、用語集操作、S3入出力権限を用途ごとに限定する。
  • S3/KMS: バッチ翻訳の入力文書、出力結果、用語集、parallel dataはS3のブロックパブリックアクセスとKMS暗号化で保護する。
  • VPCエンドポイント: AWS PrivateLinkを使い、VPC内からAmazon Translate APIへプライベート接続できる。
  • 監査: CloudTrailでAPI呼び出しを記録し、CloudWatch/EventBridgeでジョブ失敗や異常利用を検知する。
  • 機密データ: 翻訳対象に個人情報や機密情報が含まれる場合は、ComprehendのPII検出やアプリ側マスキングと組み合わせる。
  • 出力管理: 翻訳結果も機密情報になり得るため、保存期間、アクセス権、ログ出力の範囲を設計する。

5. 料金形態

Amazon Translateは主に翻訳した文字数に基づく従量課金です。非同期ジョブやカスタマイズ機能でも、処理文字数と周辺リソースを意識します。

  • リアルタイム翻訳: TranslateTextで翻訳した文字数に応じて課金される。
  • バッチ翻訳: S3文書の翻訳文字数に応じて課金され、S3保存やデータ転送の周辺コストも発生する。
  • Custom Terminology: 用語集自体よりも、用語集を適用して翻訳した文字数が課金対象になる。
  • Active Custom Translation: parallel dataを使った翻訳処理量や関連ストレージを見積もる。
  • コスト最適化: 同じ文面はキャッシュし、不要な再翻訳を避け、短文の重複翻訳を集約する。

6. よくあるアーキテクチャ・設計パターン

  • 多言語チャット: ユーザー入力をTranslateで共通言語へ翻訳し、返信をユーザー言語へ戻す。
  • グローバルサポート: 問い合わせ文をTranslateで翻訳し、Comprehendで感情やキーフレーズを分析する。
  • ナレッジベース翻訳: S3上の文書をバッチ翻訳し、OpenSearch ServiceやKendraへ多言語インデックスを作る。
  • 字幕多言語化: Transcribeで字幕を作成し、Translateで翻訳して複数言語字幕を生成する。
  • 音声コンテンツ多言語化: Translateで翻訳したテキストをPollyで読み上げ、S3/CloudFrontで配信する。
  • 企業用語統一: Custom Terminologyでブランド名や製品名の訳語を固定する。

7. 設定・デプロイ手順(ハンズオン例)

  1. TranslateコンソールまたはCLI/SDKで短いテキストを翻訳し、ソース言語とターゲット言語を確認する。
  2. アプリケーション用IAMロールに、必要なTranslate APIだけを許可する。
  3. 専門用語がある場合はCSV/TMXなどでCustom Terminologyを作成し、翻訳時に指定する。
  4. 大量文書はS3入力/出力バケットを用意し、StartTextTranslationJobでバッチ翻訳を実行する。
  5. ドメイン翻訳品質を改善したい場合はparallel dataを準備し、Active Custom Translationを試す。
  6. 翻訳結果をキャッシュし、CloudTrail、CloudWatch、KMS、S3ログで監査と保護を確認する。

8. 試験で問われやすいポイント

8.1 サービス選択

  • Q: Amazon Translateは何をするサービス?
    A: テキストや文書を複数言語間で翻訳するニューラル機械翻訳サービス。
  • Q: 音声を文字起こしして翻訳したい場合の組み合わせは?
    A: Transcribeで音声をテキスト化し、Translateで翻訳する。
  • Q: 翻訳結果を音声で読み上げるには?
    A: Translateで翻訳し、Pollyで音声化する。

8.2 リアルタイムとバッチ

  • Q: チャットの短文を即時翻訳するAPIは?
    A: TranslateText。
  • Q: S3上の大量文書を一括翻訳するには?
    A: StartTextTranslationJobによる非同期バッチ翻訳を使う。
  • Q: バッチ翻訳の入力/出力先は?
    A: Amazon S3。

8.3 カスタマイズ

  • Q: ブランド名や製品名の訳語を固定するには?
    A: Custom Terminologyを使う。
  • Q: 業界ドメインに合わせて翻訳品質を改善したい場合は?
    A: parallel dataを使うActive Custom Translationを検討する。
  • Q: 同じ文面を何度も翻訳する場合のコスト最適化は?
    A: 翻訳結果をキャッシュし、再翻訳を避ける。

8.4 セキュリティ

  • Q: バッチ翻訳の文書を安全に扱うには?
    A: S3ブロックパブリックアクセス、KMS暗号化、IAM最小権限、CloudTrail監査を組み合わせる。
  • Q: VPC内からTranslate APIへプライベート接続するには?
    A: VPCエンドポイント(AWS PrivateLink)を使う。
  • Q: 翻訳前に個人情報を検出・マスクしたい場合は?
    A: Amazon ComprehendのPII検出/リダクションと組み合わせる。

8.5 料金

  • Q: Translateの主な課金軸は?
    A: 翻訳した文字数。
  • Q: バッチ翻訳で追加で見積もるべき周辺コストは?
    A: S3保存、KMS、Lambda/Step Functions、CloudWatch Logs、データ転送など。