Los modos de Deployment son una configuración a nivel del proyecto. Si cambias entre los dos modos, no se mueven ni se borran tus datos del otro modo. Puedes usar la API de UpdateRagEngineConfig para cambiar entre los modos de implementación de Spanner y sin servidores. También puedes usar esta API para establecer el nivel en tu modo de implementación de Spanner o para anular el aprovisionamiento de tu modo de Spanner y detener la facturación. Puedes usar la API de GetRagEngineConfig para leer la información actual del modo de implementación.
Cómo cambiar al modo sin servidores
En los siguientes ejemplos de código, se muestra cómo cambiar tu RagEngineConfig al modo sin servidores:
Console
- En la Google Cloud consola, dirígete a la página RAG Engine.
- Selecciona la región en la que se ejecuta tu Vertex AI RAG Engine.
- Haz clic en la opción Cambiar al modo sin servidores. Es posible que no esté visible si estás en el modo sin servidores. Puedes verificar tu modo actual en la etiqueta de modo en la sección superior derecha de la página.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'serverless': {}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Serverless()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Cómo cambiar al modo de Spanner
En los siguientes ejemplos de código, se muestra cómo cambiar tu RagEngineConfig al modo de Spanner. Si usaste el modo de Spanner anteriormente y elegiste un nivel, no es necesario que lo proporciones de forma explícita mientras cambias. De lo contrario, consulta los ejemplos de código inferiores para obtener información sobre cómo cambiar al modo de Spanner mientras proporcionas un nivel.
Console
- En la Google Cloud consola, dirígete a la página RAG Engine.
- Selecciona la región en la que se ejecuta tu Vertex AI RAG Engine.
- Haz clic en la opción Cambiar a Spanner. Es posible que no esté visible si estás en el modo de Spanner. Puedes verificar tu modo actual en la etiqueta de modo.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Cómo leer tu RagEngineConfig actual
En los siguientes ejemplos de código, se muestra cómo leer tu RagEngineConfig para ver qué modo y nivel se eligieron:
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config = rag.rag_data.get_rag_engine_config(
name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
)
print(rag_engine_config)
Cómo actualizar el nivel en el modo de Spanner
En los siguientes ejemplos de código, se muestra cómo actualizar el nivel en el modo de Spanner:
Actualiza tu RagEngineConfig al nivel escalado del modo de Spanner
En los siguientes ejemplos de código, se muestra cómo configurar el RagEngineConfig en el modo de Spanner con el nivel escalado:
Console
- En la Google Cloud consola, dirígete a la página RAG Engine.
- Selecciona la región en la que se ejecuta tu Vertex AI RAG Engine.
- Haz clic en la opción Cambiar a Spanner si aún no estás en el modo de Spanner.
- Haz clic en Configurar RAG Engine. Aparecerá el panel Configurar RAG Engine.
- Selecciona el nivel con el que deseas ejecutar tu RAG Engine.
- Haz clic en Guardar.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'scaled': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Scaled())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Actualiza tu RagEngineConfig al modo de Spanner con el nivel básico
En los siguientes ejemplos de código, se muestra cómo configurar el RagEngineConfig en el modo de Spanner con el nivel básico:
Console
- En la Google Cloud consola, dirígete a la página RAG Engine.
- Selecciona la región en la que se ejecuta tu Vertex AI RAG Engine.
- Haz clic en la opción Cambiar a Spanner si aún no estás en el modo de Spanner.
- Haz clic en Configurar RAG Engine. Aparecerá el panel Configurar RAG Engine.
- Selecciona el nivel con el que deseas ejecutar tu RAG Engine.
- Haz clic en Guardar.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'basic': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Basic())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Actualiza tu RagEngineConfig al nivel no aprovisionado
En los siguientes ejemplos de código, se muestra cómo configurar el RagEngineConfig en el modo de Spanner con el nivel no aprovisionado. Esta acción borrará permanentemente todos los datos de tu modo de implementación de Spanner y detendrá los gastos de facturación que surjan de él.
Console
- En la Google Cloud consola, dirígete a la página RAG Engine.
- Selecciona la región en la que se ejecuta tu Vertex AI RAG Engine.
- Haz clic en la opción Cambiar a Spanner si aún no estás en el modo de Spanner.
- Haz clic en Borrar RAG Engine. Aparecerá un diálogo de confirmación.
- Para verificar que estás a punto de borrar tus datos en Vertex AI RAG Engine, ingresa delete.
- Haz clic en Confirmar.
- Haz clic en Guardar.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'unprovisioned': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Unprovisioned())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)