AWS認定資格 WEB問題集&徹底解説
機械学習エンジニア–アソシエイト
AWSサービスの一つであるAmazon Bedrockはどんな内容なのでしょうか?また、AWS認定資格の機械学習エンジニア-アソシエイト(MLA)に合格するためには、サービスのどんなポイントを押さえておけばよいのでしょうか?
ここでは、そんなあなたの疑問に回答していきたいと思います
1. サービス概要
Amazon Bedrockは、Amazonおよび主要AIプロバイダーの基盤モデル(Foundation Model: FM)を、インフラ管理なしにAPI経由で利用できるフルマネージド生成AIサービスです。 テキスト生成、要約、分類、会話、埋め込み、画像生成、マルチモーダル処理などを、モデルプロバイダーごとの基盤管理を意識せずにアプリケーションへ組み込めます。
単に「生成AIを呼び出すAPI」ではなく、Knowledge BasesによるRAG、Agentsによるタスク実行、Guardrailsによる安全制御、モデルカスタマイズ、推論スループット設計まで含めて理解することが重要です。 独自モデルを学習・運用するSageMaker AIに対し、Bedrockは既存の高性能FMを安全に選択・拡張・運用するサービスです。
2. 主な特徴と機能
2.1 複数プロバイダーの基盤モデル
Bedrockでは、テキスト、埋め込み、画像、マルチモーダルなど用途に応じて複数プロバイダーのFMを選択できます。 モデルごとに対応リージョン、入力/出力形式、コンテキスト長、レイテンシ、価格、カスタマイズ可否が異なるため、試験では要件に合うモデルを選ぶ観点が問われます。
2.2 推論APIとアプリ統合
InvokeModel系APIに加え、Converse API/ConverseStreamは会話型アプリをモデル横断で実装しやすくする統一APIです。 Lambda、API Gateway、AppSync、Step Functions、EventBridge、S3、OpenSearch Serviceなどと組み合わせて、サーバーレスな生成AIアプリを構築できます。
2.3 Knowledge Bases for Amazon Bedrock
Knowledge Basesは、S3などのデータソースを取り込み、埋め込みモデルとベクトルストアを使ってRAG(Retrieval-Augmented Generation)を構築する機能です。 モデルの再学習ではなく、社内文書やFAQを検索して回答に根拠を与えたい場合に選択します。
2.4 Agents for Amazon Bedrock
Agentsは、ユーザーの目的を分解し、Knowledge BasesやAPIアクションを呼び出して複数ステップのタスクを実行します。 予約、検索、チケット作成、ワークフロー起動など、外部システム連携を伴うユースケースで重要です。
2.5 Guardrailsと責任あるAI
Guardrailsは、有害カテゴリ、拒否トピック、機密情報、単語フィルタ、コンテキスト根拠チェックなどを使い、入力と出力の安全性を制御します。 モデル単体の性能だけでなく、企業ポリシーに沿った応答制御を行う点が試験で狙われます。
2.6 モデルカスタマイズと評価
ユースケースに応じて、ファインチューニング、継続事前学習、モデル評価、プロンプト管理などを利用できます。 ただし、最新情報を入れたいだけならカスタマイズよりRAGが適することが多く、試験でもこの使い分けが重要です。
3. アーキテクチャおよび技術要素
- アプリケーションがAWS SDK、Converse API、またはInvokeModel APIでBedrock Runtimeを呼び出す。
- IAMポリシーで利用可能なモデル、Knowledge Base、Agent、Guardrailへのアクセスを制御する。
- RAGが必要な場合は、S3などのデータソースをKnowledge Basesへ同期し、埋め込みとベクトル検索で関連文書を取得する。
- 外部処理が必要な場合は、AgentsがアクショングループとしてLambdaやAPIを呼び出す。
- Guardrailsで入力/出力を評価し、ポリシー違反や機密情報を制御する。
- CloudTrail、CloudWatch、Bedrockのログ/評価機能を使い、利用状況、品質、コストを監視する。
本番設計では、オンデマンド推論、バッチ推論、Provisioned Throughputの使い分け、リージョンごとのモデル可用性、レイテンシ、データガバナンスを同時に検討します。
4. セキュリティと認証・認可
- IAM制御:
bedrock:InvokeModel、モデルID、Knowledge Base、Agent、Guardrail単位で最小権限を設計する。 - モデルアクセス管理: 利用するモデルはアカウント/リージョンで有効化し、不要なモデル利用を制限する。
- データ保護: 通信はTLSで保護され、保存データや関連リソースにはKMS暗号化を利用できる。プロンプトやレスポンスの扱いは企業ポリシーに合わせてログ設定を管理する。
- プライベート接続: VPCエンドポイント(AWS PrivateLink)を利用し、インターネットを経由せずBedrock APIへ接続できる。
- 監査: CloudTrailでAPI呼び出しを記録し、CloudWatchやサービスログで運用状況を確認する。
- 安全制御: Guardrailsで有害コンテンツ、拒否トピック、PII/機密情報、根拠不足の応答を抑制する。
5. 料金形態
Bedrockはモデルや機能ごとに課金軸が異なります。試験では「どのリソースが課金対象か」と「安定した高スループットが必要な場合の選択」がよく問われます。
- オンデマンド推論: 入力/出力トークン数、画像枚数、動画/音声処理量など、モデルごとの利用量に応じて課金される。
- バッチ推論: 大量リクエストを非同期に処理し、リアルタイム性が不要な処理でコスト/運用を最適化しやすい。
- Provisioned Throughput: 安定したスループットや低レイテンシが必要な本番ワークロード向けに、モデル処理能力を予約する。
- カスタマイズ: ファインチューニングや継続事前学習の学習時間、カスタムモデルの保存、推論利用が課金対象になる。
- Knowledge Bases/Agents/Guardrails: ベクトルストア、埋め込み、取り込み、API呼び出し、関連AWSサービスの利用料が発生する。
- コスト最適化: 小型モデルの選択、プロンプト短縮、キャッシュ、RAGの検索件数調整、バッチ化、利用量監視を組み合わせる。
6. よくあるアーキテクチャ・設計パターン
- 社内文書Q&A: S3の文書をKnowledge Basesへ同期し、BedrockのFMで根拠付き回答を生成する。
- 生成AIチャットボット: API Gateway/LambdaまたはAppSyncからConverse APIを呼び出し、セッション状態と監査ログを管理する。
- 業務エージェント: Agentsがユーザー意図を解釈し、LambdaアクショングループでCRM、予約、チケット、注文システムを操作する。
- 安全なコンテンツ生成: Guardrailsで禁止トピックやPIIを制御し、生成結果を人間レビューやワークフローへ渡す。
- 大量要約/分類: S3に入力を置き、バッチ推論で文書要約、分類、抽出を非同期処理する。
- 独自ドメイン最適化: RAGで最新情報を補強し、それでも表現やタスク適合が不足する場合にモデルカスタマイズを検討する。
7. 設定・デプロイ手順(ハンズオン例)
- Bedrockコンソールで利用リージョンと必要な基盤モデルのアクセスを確認する。
- IAMポリシーでアプリケーションロールに必要なモデル呼び出し権限だけを付与する。
- コンソールのプレイグラウンドまたはSDKからConverse API/InvokeModel APIを実行する。
- 社内文書Q&Aが必要な場合は、S3データソース、埋め込みモデル、ベクトルストアを指定してKnowledge Baseを作成する。
- 外部API操作が必要な場合は、Agentとアクショングループ(Lambdaなど)を設定する。
- Guardrailを作成し、禁止トピック、コンテンツフィルタ、機密情報フィルタをアプリケーションに関連付ける。
- CloudTrail、CloudWatch、コスト配分タグ、AWS Budgetsで利用状況と費用を監視する。
8. 試験で問われやすいポイント
8.1 サービス選択
- Q: Amazon Bedrockは何を提供するサービス?
A: 複数プロバイダーの基盤モデルをフルマネージドにAPI利用し、生成AIアプリを構築するサービス。 - Q: SageMaker AIとの違いは?
A: Bedrockは既存FMの利用・拡張が中心、SageMaker AIは独自MLモデルの構築、学習、デプロイ、MLOpsが中心。 - Q: 最新の社内文書を回答に反映したい場合は?
A: モデル再学習よりKnowledge BasesによるRAGを優先する。
8.2 RAGとAgents
- Q: Knowledge Basesは何に使う?
A: 文書を取り込み、埋め込みとベクトル検索で関連情報を取得し、FMの回答に根拠を与える。 - Q: 外部APIを呼び出して複数ステップの業務を実行したい場合は?
A: Agents for Amazon Bedrockを使い、アクショングループとしてLambdaやAPIを連携する。 - Q: RAGで使う代表的な保存先は?
A: S3をデータソースにし、OpenSearch Serverlessなどのベクトルストアと組み合わせる構成が代表的。
8.3 安全性とガバナンス
- Q: 有害な応答や禁止トピックを制御するには?
A: Guardrails for Amazon Bedrockを使う。 - Q: Bedrock APIをインターネット経由にしたくない場合は?
A: VPCエンドポイント(AWS PrivateLink)を使う。 - Q: モデル呼び出し権限を最小化するには?
A: IAMでモデルID、アクション、リソース単位に権限を制御する。 - Q: BedrockのAPI利用を監査するには?
A: CloudTrailでAPI呼び出しを記録し、CloudWatchやログ設定で運用状況を確認する。
8.4 推論と料金
- Q: Bedrockのオンデマンド推論は主に何で課金される?
A: モデルごとの入力/出力トークン、画像、音声、動画などの処理量で課金される。 - Q: 安定した高スループットと低レイテンシが必要な本番用途は?
A: Provisioned Throughputを検討する。 - Q: 大量文書の要約や分類を非同期に処理したい場合は?
A: バッチ推論を使う。 - Q: Bedrockのコストを抑える基本策は?
A: 要件に合う小型モデル選択、プロンプト短縮、RAG検索件数調整、バッチ化、利用量監視を行う。
8.5 モデルカスタマイズ
- Q: モデルに最新情報を覚えさせたいだけの場合はファインチューニングが最適?
A: いいえ。最新情報や社内文書の参照はRAGが適し、出力スタイルや特定タスクへの適合を高めたい場合にカスタマイズを検討する。 - Q: 複数モデルを横断して会話アプリを実装しやすいAPIは?
A: Converse APIまたはConverseStreamを使う。