Amazon Bedrock Knowledge Bases入門 - 5分でRAG環境を構築する方法 - Yukishi log.

Warning: Undefined property: stdClass::$access_token in /home/yukishi2/yukishi.com/public_html/wp-content/plugins/yyi-rinker/yyi_rinker_main.php on line 2322

「社内ドキュメントを ChatGPT に読ませて Q&A を返したいけれど、ベクトル DB の構築が面倒…」　そんな悩みを一撃で解決してくれるのが、2025-04-08 に GA となった Amazon Bedrock Knowledge Bases です。わずか 5 分 で RAG （Retrieval-Augmented Generation）環境を構築し、PDF や Wiki を “引用付き回答” に変える手順をまとめました。

この記事を読めば――

Vector Store とデータソースをセットアップ → 同期 → クエリ確認までの手順が分かる
RetrieveAndGenerate API 1 行で動く最小コードをそのままコピペできる
ランニングコストや権限まわりの ハマりポイント を事前に回避できる

「まずは動く PoC を最短で立てたい」という方は、以下のハンズオンを試してみてください。

Warning: Undefined property: stdClass::$access_token in /home/yukishi2/yukishi.com/public_html/wp-content/plugins/yyi-rinker/yyi_rinker_main.php on line 2322

目次閉じる

Knowledge Bases とは？
5 分クイックスタート
boto3 で Retrieve & Generate
クエリ検証 & コスト確認
まとめ

Knowledge Bases とは？

Bedrock が提供する “RAG as a Service”。社内文書をベクトル化して保存し、Retrieve（検索）と Generate（生成）をひとつの API で実行できます。

現時点の対応 Vector Store : Aurora PostgreSQL pgvector / OpenSearch Serverless / Redis Enterprise Cloud（2025-05）

5 分クイックスタート

コンソールだけで動く最短セットアップ手順を紹介します。5 分以内に RAG を立ち上げることができます。

Bedrock Console › Knowledge base で Create をクリック

名前・説明・リージョン（例: ap-northeast-1）を入力

（例: ap-northeast-1）

Vector Store に AuroraServerless-pgvector などを選択

データソースとして S3 バケットを指定し、PDF / Markdown をアップロード

Sync now を押すとインデックス作成が始まり、平均 3–4 分で完了

ステータスが Available、Vector count が 0 → N になれば準備完了！

boto3 で Retrieve & Generate

SDK を使った最小コード例で、Knowledge Bases API がどのように呼び出せるのかを確認できます。

python

import boto3, json
kb_id = "kb-xxxxxxxx" # 作成した Knowledge Base ID
client = boto3.client("bedrock-agent-runtime", region_name="ap-northeast-1")
res = client.retrieve_and_generate( knowledgeBaseId=kb_id, input={"text": "グラビトン4のメリットを教えて"}
)
print(res["output"]["text"]) # 回答本文
print(res["citations"]) # 引用元 S3 URI とページ番号

Point

裏側では Retrieve → Augment → Generate の 3 ステップを自動実行

コストは Embed tokens + Retrieve + モデル推論。初回同期以降は差分のみ課金