「社内ドキュメントを ChatGPT に読ませて Q&A を返したいけれど、ベクトル DB の構築が面倒…」 そんな悩みを一撃で解決してくれるのが、2025-04-08 に GA となった Amazon Bedrock Knowledge Bases です。わずか 5 分 で RAG (Retrieval-Augmented Generation)環境を構築し、PDF や Wiki を “引用付き回答” に変える手順をまとめました。
この記事を読めば――
- Vector Store とデータソースをセットアップ → 同期 → クエリ確認までの手順が分かる
RetrieveAndGenerate
API 1 行で動く最小コードをそのままコピペできる- ランニングコストや権限まわりの ハマりポイント を事前に回避できる
「まずは動く PoC を最短で立てたい」という方は、以下のハンズオンを試してみてください。
Knowledge Bases とは?
Bedrock が提供する “RAG as a Service”。社内文書をベクトル化して保存し、Retrieve
(検索)と Generate
(生成)をひとつの API で実行できます。
現時点の対応 Vector Store : Aurora PostgreSQL pgvector / OpenSearch Serverless / Redis Enterprise Cloud(2025-05)
5 分クイックスタート
コンソールだけで動く最短セットアップ手順を紹介します。5 分以内に RAG を立ち上げることができます。
ap-northeast-1
)を入力(例: ap-northeast-1
)
ステータスが Available
、Vector count が 0 → N になれば準備完了!
boto3 で Retrieve & Generate
SDK を使った最小コード例で、Knowledge Bases API がどのように呼び出せるのかを確認できます。
import boto3, json
kb_id = "kb-xxxxxxxx" # 作成した Knowledge Base ID
client = boto3.client("bedrock-agent-runtime", region_name="ap-northeast-1")
res = client.retrieve_and_generate( knowledgeBaseId=kb_id, input={"text": "グラビトン4のメリットを教えて"}
)
print(res["output"]["text"]) # 回答本文
print(res["citations"]) # 引用元 S3 URI とページ番号
裏側では Retrieve
→ Augment
→ Generate
の 3 ステップを自動実行
コストは Embed tokens + Retrieve + モデル推論。初回同期以降は差分のみ課金
クエリ検証 & コスト確認
回答品質と課金状況をチェックする方法について手番を紹介します。
/aws/bedrock/knowledge-base
で処理時間を確認実際に PoC を回すときに遭遇しやすい落とし穴と、その回避策を紹介します。
- S3 SSE-KMS バケットは、同期ロールに
kms:Decrypt
権限が必要 - 画像だけの PDF は OCR されない → Textract などで事前テキスト化
- Vector Store の 暗号化キー切替 後は再同期しないとヒット率が低下
まとめ
最後に、Knowledge Bases 導入で得られるメリットと次のアクションをご紹介します。
- Knowledge Bases なら “ベクトル DB 構築 → 埋め込み → 検索 → 生成” を クリック操作だけ で完了
- 社内 FAQ・ドキュメント検索・ナレッジ共有に最適
- Prompt Caching を併用すればランニングコストを 追加で 30–50 % 削減
- GraphRAG(2025-03 GA)との組み合わせ検証も近日公開予定!