Amazon Bedrock Knowledge Bases入門 – 5分でRAG環境を構築する方法

Amazon Bedrock Knowledge Bases入門 – 5分でRAG環境を構築する方法

「社内ドキュメントを ChatGPT に読ませて Q&A を返したいけれど、ベクトル DB の構築が面倒…」 そんな悩みを一撃で解決してくれるのが、2025-04-08 に GA となった Amazon Bedrock Knowledge Bases です。わずか 5 分RAG (Retrieval-Augmented Generation)環境を構築し、PDF や Wiki を “引用付き回答” に変える手順をまとめました。

この記事を読めば――

  1. Vector Store とデータソースをセットアップ → 同期 → クエリ確認までの手順が分かる
  2. RetrieveAndGenerate API 1 行で動く最小コードをそのままコピペできる
  3. ランニングコストや権限まわりの ハマりポイント を事前に回避できる

「まずは動く PoC を最短で立てたい」という方は、以下のハンズオンを試してみてください。

Knowledge Bases とは?

Bedrock が提供する “RAG as a Service”。社内文書をベクトル化して保存し、Retrieve(検索)と Generate(生成)をひとつの API で実行できます。

現時点の対応 Vector Store : Aurora PostgreSQL pgvector / OpenSearch Serverless / Redis Enterprise Cloud(2025-05)


5 分クイックスタート

コンソールだけで動く最短セットアップ手順を紹介します。5 分以内に RAG を立ち上げることができます。

Bedrock Console › Knowledge baseCreate をクリック
名前・説明・リージョン(例: ap-northeast-1)を入力

(例: ap-northeast-1

Vector Store に AuroraServerless-pgvector などを選択
データソースとして S3 バケットを指定し、PDF / Markdown をアップロード
Sync now を押すとインデックス作成が始まり、平均 3–4 分で完了

ステータスが AvailableVector count が 0 → N になれば準備完了!


boto3 で Retrieve & Generate

SDK を使った最小コード例で、Knowledge Bases API がどのように呼び出せるのかを確認できます。

python
import boto3, json
kb_id = "kb-xxxxxxxx" # 作成した Knowledge Base ID
client = boto3.client("bedrock-agent-runtime", region_name="ap-northeast-1")
res = client.retrieve_and_generate( knowledgeBaseId=kb_id, input={"text": "グラビトン4のメリットを教えて"}
)
print(res["output"]["text"]) # 回答本文
print(res["citations"]) # 引用元 S3 URI とページ番号
Point

裏側では RetrieveAugmentGenerate の 3 ステップを自動実行

コストは Embed tokens + Retrieve + モデル推論。初回同期以降は差分のみ課金


クエリ検証 & コスト確認

回答品質と課金状況をチェックする方法について手番を紹介します。

Bedrock Console › Query タブで質問を入力
回答と一緒に 引用元リンク が表示 → クリックで該当ページへ
CloudWatch Logs の /aws/bedrock/knowledge-base で処理時間を確認
Cost Explorer で UsageType = KnowledgeBase-Retrieve をフィルタ

ハマるポイント

実際に PoC を回すときに遭遇しやすい落とし穴と、その回避策を紹介します。

  • S3 SSE-KMS バケットは、同期ロールに kms:Decrypt 権限が必要
  • 画像だけの PDF は OCR されない → Textract などで事前テキスト化
  • Vector Store の 暗号化キー切替 後は再同期しないとヒット率が低下


まとめ

最後に、Knowledge Bases 導入で得られるメリットと次のアクションをご紹介します。

  • Knowledge Bases なら “ベクトル DB 構築 → 埋め込み → 検索 → 生成” を クリック操作だけ で完了
  • 社内 FAQ・ドキュメント検索・ナレッジ共有に最適
  • Prompt Caching を併用すればランニングコストを 追加で 30–50 % 削減
  • GraphRAG(2025-03 GA)との組み合わせ検証も近日公開予定!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA