このページでは、RAG Engine の概要と動作について説明します。
| 説明 | コンソール |
|---|---|
| Vertex AI SDK を使用して Gemini Enterprise Agent Platform で RAG Engine タスクを実行する方法については、Python の RAG クイックスタートをご覧ください。 | RAG Engine を試す |
概要
RAG Engine は Gemini Enterprise Agent Platform のコンポーネントであり、検索拡張生成(RAG)を容易にします。 RAG Engine は、コンテキスト拡張型大規模言語モデル(LLM)アプリケーションを開発するためのデータ フレームワークでもあります。コンテキストの拡張は、LLM をデータに適用するときに行われます。これは、検索拡張生成(RAG)を実装します。
LLM の一般的な問題は、プライベート データ(組織のデータ)を理解していないことです。RAG Engine を使用すると、追加の非公開情報で LLM のコンテキストを拡充できます。これにより、モデルはハルシネーションを低減し、質問に正確に答えることができます。
追加の情報源と LLM が持つ既存の知識を組み合わせることで、より優れたコンテキストが提供されます。クエリとともにコンテキストが改善されることで、LLM のレスポンスの品質が向上します。
次の図は、RAG Engine を理解するための主なコンセプトを示しています。

これらのコンセプトは、検索拡張生成(RAG)プロセスの順序で記載されています。
データの取り込み: さまざまなデータソースからデータを取り込みます。たとえば、ローカル ファイル、Cloud Storage、Google ドライブが該当します。
データ変換: インデックス登録の準備としてデータを変換します。たとえば、データはチャンクに分割されます。
エンベディング: 単語やテキストの断片の数値表現。これらの数値は、テキストの意味論的意味とコンテキストを表す。類似または関連する単語やテキストは、エンベディングが類似する傾向がある。つまり、高次元ベクトル空間内で近接する。
データのインデックス登録: RAG Engine は、 コーパスと呼ばれるインデックスを作成します。インデックスは、検索用に最適化されるようにナレッジベースを構造化する。たとえば、インデックスは、膨大な参考書の詳細な目次のようなものです。
取得: ユーザーが質問をするか、プロンプトを指定すると、RAG Engine の検索 コンポーネントがナレッジ ベースを検索し、クエリに関連する情報を探します。
生成: 取得した情報は、生成 AI モデルが事実に基づいた関連性の高いレスポンスを生成するためのガイドとして、 元のユーザークエリに追加されるコンテキストになります。
サポートされるリージョン
RAG Engine は、次のリージョンでサポートされています。
| リージョン | ロケーション | 説明 | リリース ステージ |
|---|---|---|---|
us-central1 |
アイオワ | v1 バージョンと v1beta1 バージョンがサポートされています。 |
許可リスト、一般提供 |
us-east4 |
バージニア | v1 バージョンと v1beta1 バージョンがサポートされています。 |
許可リスト、一般提供 |
us-east1 |
サウスカロライナ州モンクスコーナー | v1 バージョンと v1beta1 バージョンがサポートされています。 |
許可リスト、プレビュー |
europe-west3 |
フランクフルト(ドイツ) | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
europe-west4 |
エームスハーヴェン(オランダ) | v1 バージョンと v1beta1 バージョンがサポートされています。 |
GA |
asia-east1 |
台湾 | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
asia-northeast1 |
東京 | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
asia-northeast3 |
ソウル | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
asia-south1 |
ムンバイ | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
asia-southeast1 |
シンガポール | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-central2 |
ワルシャワ | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-north1 |
フィンランド | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-southwest1 |
マドリード | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-west1 |
ベルギー | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-west2 |
ロンドン | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-west6 |
チューリッヒ | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-west8 |
ミラノ | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
europe-west9 |
パリ | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
us-east5 |
オハイオ州コロンバス | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
us-south1 |
テキサス州ダラス | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
us-west1 |
オレゴン | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
us-west4 |
ネバダ州ラスベガス | v1 バージョンと v1beta1 バージョンがサポートされています。 |
プレビュー |
us-central1、us-east1、us-east4はAllowlistに変更されます。RAG Engine を試す場合は、別のリージョンをお試しください。
RAG Engine を削除
RAG Engine の削除の詳細については、以下をご覧ください。
次のステップ
Vertex AI SDK を使用して Gemini Enterprise Agent Platform で RAG Engine タスクを実行する方法については、Python の RAG クイックスタートをご覧ください。
グラウンディングについて、グラウンディング の概要で確認する。
RAG からのレスポンスの詳細については、
GenerateContentResponseをご覧ください。