Gemini Enterprise Agent Platform の RAG Engine の概要

このページでは、RAG Engine の概要と動作について説明します。

説明 コンソール
Vertex AI SDK を使用して Gemini Enterprise Agent Platform で RAG Engine タスクを実行する方法については、Python の RAG クイックスタートをご覧ください。 RAG Engine を試す

概要

RAG Engine は Gemini Enterprise Agent Platform のコンポーネントであり、検索拡張生成(RAG)を容易にします。 RAG Engine は、コンテキスト拡張型大規模言語モデル(LLM)アプリケーションを開発するためのデータ フレームワークでもあります。コンテキストの拡張は、LLM をデータに適用するときに行われます。これは、検索拡張生成(RAG)を実装します。

LLM の一般的な問題は、プライベート データ(組織のデータ)を理解していないことです。RAG Engine を使用すると、追加の非公開情報で LLM のコンテキストを拡充できます。これにより、モデルはハルシネーションを低減し、質問に正確に答えることができます。

追加の情報源と LLM が持つ既存の知識を組み合わせることで、より優れたコンテキストが提供されます。クエリとともにコンテキストが改善されることで、LLM のレスポンスの品質が向上します。

次の図は、RAG Engine を理解するための主なコンセプトを示しています。

Agent Platform RAG の主なコンセプト

これらのコンセプトは、検索拡張生成(RAG)プロセスの順序で記載されています。

  1. データの取り込み: さまざまなデータソースからデータを取り込みます。たとえば、ローカル ファイル、Cloud Storage、Google ドライブが該当します。

  2. データ変換: インデックス登録の準備としてデータを変換します。たとえば、データはチャンクに分割されます。

  3. エンベディング: 単語やテキストの断片の数値表現。これらの数値は、テキストの意味論的意味とコンテキストを表す。類似または関連する単語やテキストは、エンベディングが類似する傾向がある。つまり、高次元ベクトル空間内で近接する。

  4. データのインデックス登録: RAG Engine は、 コーパスと呼ばれるインデックスを作成します。インデックスは、検索用に最適化されるようにナレッジベースを構造化する。たとえば、インデックスは、膨大な参考書の詳細な目次のようなものです。

  5. 取得: ユーザーが質問をするか、プロンプトを指定すると、RAG Engine の検索 コンポーネントがナレッジ ベースを検索し、クエリに関連する情報を探します。

  6. 生成: 取得した情報は、生成 AI モデルが事実に基づいた関連性の高いレスポンスを生成するためのガイドとして、 元のユーザークエリに追加されるコンテキストになります。

サポートされるリージョン

RAG Engine は、次のリージョンでサポートされています。

リージョン ロケーション 説明 リリース ステージ
us-central1 アイオワ v1 バージョンと v1beta1 バージョンがサポートされています。 許可リスト、一般提供
us-east4 バージニア v1 バージョンと v1beta1 バージョンがサポートされています。 許可リスト、一般提供
us-east1 サウスカロライナ州モンクスコーナー v1 バージョンと v1beta1 バージョンがサポートされています。 許可リスト、プレビュー
europe-west3 フランクフルト(ドイツ) v1 バージョンと v1beta1 バージョンがサポートされています。 GA
europe-west4 エームスハーヴェン(オランダ) v1 バージョンと v1beta1 バージョンがサポートされています。 GA
asia-east1 台湾 v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
asia-northeast1 東京 v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
asia-northeast3 ソウル v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
asia-south1 ムンバイ v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
asia-southeast1 シンガポール v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-central2 ワルシャワ v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-north1 フィンランド v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-southwest1 マドリード v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-west1 ベルギー v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-west2 ロンドン v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-west6 チューリッヒ v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-west8 ミラノ v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
europe-west9 パリ v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
us-east5 オハイオ州コロンバス v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
us-south1 テキサス州ダラス v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
us-west1 オレゴン v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
us-west4 ネバダ州ラスベガス v1 バージョンと v1beta1 バージョンがサポートされています。 プレビュー
  • us-central1us-east1us-east4Allowlist に変更されます。RAG Engine を試す場合は、別のリージョンをお試しください。

RAG Engine を削除

RAG Engine の削除の詳細については、以下をご覧ください。

次のステップ