Passer d'un mode à l'autre

Les modes de déploiement sont une configuration au niveau du projet. Passer d'un mode à l'autre ne déplace ni ne supprime vos données de l'autre mode. Vous pouvez utiliser l'API UpdateRagEngineConfig pour basculer entre les modes de déploiement sans serveur et Spanner. Vous pouvez également utiliser cette API pour définir le niveau de votre mode de déploiement Spanner ou pour annuler le provisionnement de votre mode Spanner afin d'arrêter la facturation. Vous pouvez utiliser l'API GetRagEngineConfig pour lire les informations sur votre mode de déploiement actuel.

Passer en mode sans serveur

Les exemples de code suivants montrent comment passer votre RagEngineConfig en mode sans serveur :

Console

  1. Dans la console Google Cloud , accédez à la page RAG Engine.

    Accéder au moteur RAG

  2. Sélectionnez la région dans laquelle votre moteur RAG est exécuté.
  3. Cliquez sur l'option Passer en mode sans serveur. Il est possible qu'il ne soit pas visible si vous êtes en mode sans serveur. Vous pouvez vérifier votre mode actuel à partir du libellé du mode en haut à droite de la page.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'serverless': {}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Serverless()),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

Passer en mode Spanner

Les exemples de code suivants montrent comment passer de RagEngineConfig au mode Spanner. Si vous avez déjà utilisé le mode Spanner et choisi un niveau, vous n'avez pas besoin de le fournir explicitement lors du changement de mode. Sinon, reportez-vous aux exemples de code ci-dessous pour savoir comment passer en mode Spanner tout en fournissant un niveau.

Console

  1. Dans la console Google Cloud , accédez à la page RAG Engine.

    Accéder au moteur RAG

  2. Sélectionnez la région dans laquelle votre moteur RAG est exécuté.
  3. Cliquez sur l'option Passer à Spanner. Il est possible qu'il ne soit pas visible si vous êtes en mode Spanner. Vous pouvez vérifier votre mode actuel à partir du libellé du mode.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner()),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

Lire votre RagEngineConfig actuel

Les exemples de code suivants montrent comment lire votre RagEngineConfig pour voir le mode et le niveau choisis :

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config = rag.rag_data.get_rag_engine_config(
    name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
)

print(rag_engine_config)

Modifier le niveau en mode Spanner

Les exemples de code suivants montrent comment modifier le niveau en mode Spanner :

Mettre à jour votre RagEngineConfig vers le niveau Scaled du mode Spanner

Les exemples de code suivants montrent comment définir RagEngineConfig sur le mode Spanner avec le niveau "Avec scaling" :

Console

  1. Dans la console Google Cloud , accédez à la page RAG Engine.

    Accéder au moteur RAG

  2. Sélectionnez la région dans laquelle votre moteur RAG est exécuté.
  3. Cliquez sur l'option Passer à Spanner si vous n'êtes pas déjà en mode Spanner.
  4. Cliquez sur Configurer le moteur RAG. Le volet Configurer le moteur RAG s'affiche.
  5. Sélectionnez le niveau avec lequel vous souhaitez exécuter votre moteur RAG.
  6. Cliquez sur Enregistrer.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'scaled': {}}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Scaled())),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

Mettez à jour votre RagEngineConfig en mode Spanner avec le niveau de base.

Les exemples de code suivants montrent comment définir RagEngineConfig sur le mode Spanner avec le niveau de base :

Console

  1. Dans la console Google Cloud , accédez à la page RAG Engine.

    Accéder au moteur RAG

  2. Sélectionnez la région dans laquelle votre moteur RAG est exécuté.
  3. Cliquez sur l'option Passer à Spanner si vous n'êtes pas déjà en mode Spanner.
  4. Cliquez sur Configurer le moteur RAG. Le volet Configurer le moteur RAG s'affiche.
  5. Sélectionnez le niveau sur lequel vous souhaitez exécuter votre moteur RAG.
  6. Cliquez sur Enregistrer.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'basic': {}}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Basic())),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

Mettre à jour votre RagEngineConfig au niveau "Non provisionné"

Les exemples de code suivants montrent comment définir RagEngineConfig sur le mode Spanner avec le niveau non provisionné. Toutes les données de votre mode de déploiement Spanner seront alors supprimées définitivement, et les frais de facturation associés seront arrêtés.

Console

  1. Dans la console Google Cloud , accédez à la page RAG Engine.

    Accéder au moteur RAG

  2. Sélectionnez la région dans laquelle votre moteur RAG est exécuté.
  3. Cliquez sur l'option Passer à Spanner si vous n'êtes pas déjà en mode Spanner.
  4. Cliquez sur Supprimer le moteur RAG. Une boîte de dialogue de confirmation s'affiche.
  5. Vérifiez que vous êtes sur le point de supprimer vos données dans le moteur RAG en saisissant delete.
  6. Cliquez sur Confirmer.
  7. Cliquez sur Enregistrer.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'unprovisioned': {}}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Unprovisioned())),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)