Gemini Enterprise Agent Platform の RAG Engine のデプロイモード

Gemini Enterprise Agent Platform の RAG Engine には、RAG インスタンスを運用するためのさまざまなデプロイモードが用意されています。デプロイモードを選択すると、データの保存場所、データの増加に伴うストレージのスケーリング方法、必要なインフラストラクチャ管理のレベルが決まります。これらのモードの動作を理解することで、プロジェクトのシンプルさ、スケーラビリティ、費用のバランスを適切に選択できます。

RAG Engine には、サーバーレスと Spanner の 2 つのデプロイモードがあります。両方のモードをシームレスに切り替えることができます。各モード内のデータは、他のモードから分離されます。

利用可能なデプロイモード

このセクションでは、RAG Engine で使用できる 2 つのデプロイモードについて説明します。

サーバーレス モード

サーバーレス モードは、RAG Engine を使い始める際におすすめの方法です。費用対効果が高く、データベースのプロビジョニングとスケーリングをすべて抽象化した、フルマネージドのプラネット規模のエンタープライズ対応データベースを提供します。

  • 最適な対象: ほとんどのユーザー、迅速なオンボーディング、インフラストラクチャ構成を管理する必要のないシームレスなスケーリング。
  • 主な機能: ティア管理は不要です。デフォルトのベクトル データベースとして RAG マネージド ベクトル検索を自動的に使用し、すぐに使える合理化された RAG エクスペリエンスを提供します。

サーバーレス モードでは、RAG マネージド データベースは、RAG のビジネス オペレーションの管理と RAG リソースの保存に使用されます。これらのリソースには、RagCorpusRagFilesRagMetadataDataSchema などがありますが、埋め込みインデックスとベクトル検索には使用できなくなりました。

ユーザーは常に、別のベクトル データベースを個別に選択する必要があります。サーバーレス モードでは、デフォルトで、RAG Engine は、埋め込みインデックスとベクトル検索用にプロジェクトに Vector Search 2.0 コレクションをプロビジョニングします。Spanner モードと比較して、プロジェクトに Vector Search 2.0 をプロビジョニングすると、ベクトル DB の使用状況と費用を完全に可視化して制御できます。詳細な比較については、Spanner モードとサーバーレス モードをご覧ください。

Spanner モード

Spanner モードでは、RAG Engine デプロイの基盤として機能するように、専用の Spanner インフラストラクチャが割り当てられます。これは、特定のコンプライアンス機能(CMEK など)または専用の分離されたデータベース インスタンスを必要とするワークロード向けに設計されています。モードの選択が明示的に選択されていない場合は、デフォルトで Spanner モードが割り当てられます。

Spanner モードを使用する場合は、パフォーマンス ティアを選択してインフラストラクチャを管理する必要があります。

  • ベーシック ティア(デフォルト): 実験、小規模なデータサイズ、レイテンシの影響を受けないワークロードに適した、固定された費用対効果の高い低コンピューティング ティア。
  • スケーリング ティア: 自動スケーリング機能により、本番環境規模のパフォーマンスを提供します。大量のデータを処理するワークロードやパフォーマンスが重要なワークロードに適しています。

データの分離とモードの切り替え

アクティブなデプロイモードでオペレーションが進行していない限り、RAG Engine を使用すると、プロジェクトのデプロイモードを切り替えることができます。両方のモードでデータを使用できます。ただし、一度にアクティブにできるモードは 1 つのみで、データはデプロイモード間で厳密に分離されます。

便利なツールとして、プロジェクトは 2 つの完全に分離されたバックエンドがあるかのように動作します。作成したリソース(コーパス、インポートおよびアップロードされたファイル、解析された埋め込み)は、作成時にアクティブだったデプロイモードに永続的に関連付けられます。直接または Gemini を介した取得リクエストも、現在のデプロイモードに存在するコーパスとファイルに限定されます。2 つのモードを切り替えても、データが移動したり、他のモードからデータが削除されたりすることはありません。

/gemini-enterprise-agent-platform/images/rag-engine-deployment-modes.png

図に示すように:

  • 統合 API: まったく同じ Agent Platform RAG API を使用して、リソースを作成、管理します。API は、アクティブなデプロイモードに関連付けられたバックエンドにリクエストを自動的にルーティングします。
  • 可視性: サーバーレス モードがアクティブな場合、アプリケーションは RagCorpus A と B のみを表示して操作できます。Spanner モードで作成された RagCorpus C は安全に保存されますが、プロジェクトのモードを Spanner に戻すまで、アプリケーションから完全に非表示になり、アクセスできなくなります。
  • データ損失なし: モードを切り替えてもデータは削除されません。API が参照する「バックエンド」が変更されるだけです。

デプロイモードを管理する

デプロイモードはプロジェクト レベルの設定です。GetRagEngineConfig API と UpdateRagEngineConfig API を使用して、現在のモードを表示または変更できます。デプロイモードを切り替える方法と、Spanner モードに適したティアを選択する方法については、モードの切り替えをご覧ください。

データを削除して課金を停止する

データはモード間で分離されるため、リソースのクリーンアップと課金の停止のプロセスは、データの保存場所によって若干異なります。

  • サーバーレス データを削除するには: アクティブ モードがサーバーレスに設定されていることを確認します。ListRagCorpora API を呼び出してリソースを表示し、DeleteRagCorpus API を使用して各コーパスを手動で削除します。
  • Spanner データを削除するには(プロビジョニング解除): アクティブ モードが Spanner に設定されていることを確認します。RagEngineConfig を更新し、Spanner ティアを Unprovisioned に設定します。これにより、専用の Spanner インスタンスと、そのインスタンスに保持されているすべての RAG データが直ちに削除され、Spanner モードに関連する課金が停止します。注: プロビジョニング解除ティアを使用して削除されたデータは復元できません。

Spanner モードとサーバーレス モードの比較

機能 サーバーレス モード Spanner モード
費用
  • リソース管理とオーケストレーションは無料です。
  • ベクトル DB は、ユーザーの選択に応じて直接課金されます。
  • 料金はティアの選択によって異なります。リソース管理とオーケストレーションが含まれます。
  • ベクトル データベースとして RagManagedDb を選択すると、すべてのコーパスのベクトル DB の費用がカバーされます。
  • 残りのコーパスについては、ユーザーが選択したデータベースに応じてベクトル DB が直接課金されます。
スケーリング フルマネージドの自動スケーリング ティアの選択を構成する必要がありますが、自動スケーリング ティアが用意されています。
隔離 ストレージは分離されていません ストレージとパフォーマンスの分離を提供します。
CMEK 現時点では CMEK はありません CMEK をサポート
VPC Security Controls サポート対象 サポート対象
サポートされているベクトル DB
  • Managed Vector Search 2.0(デフォルト)
  • Pinecone
  • Weaviate
  • RagManagedDb(デフォルト)
  • マネージド ベクトル検索 2.0
  • ベクトル検索 1.0
  • Pinecone
  • Weaviate

次のステップ