Le modalità di deployment sono una configurazione a livello di progetto. Il passaggio da una modalità all'altra non sposta o elimina i dati dall'altra modalità. Puoi utilizzare l'API UpdateRagEngineConfig per passare dalla modalità di deployment serverless a quella Spanner. Puoi anche utilizzare questa API per impostare il livello nella modalità di deployment Spanner o per annullare il provisioning della modalità Spanner per interrompere la fatturazione. Puoi utilizzare l'API GetRagEngineConfig per leggere le informazioni sulla modalità di deployment corrente.
Passare alla modalità serverless
I seguenti esempi di codice mostrano come passare alla modalità serverless per RagEngineConfig:
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione RAG Engine.
- Fai clic sull'opzione Passa a serverless. Potrebbe non essere visibile se sei in modalità serverless. Puoi verificare la modalità attuale dall'etichetta della modalità nella sezione in alto a destra della pagina.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'serverless': {}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Serverless()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Passare alla modalità Spanner
I seguenti esempi di codice mostrano come passare alla modalità Spanner per RagEngineConfig. Se hai già utilizzato la modalità Spanner e hai scelto un livello, non devi fornirlo esplicitamente durante il passaggio. In caso contrario, consulta gli esempi di codice riportati di seguito su come passare alla modalità Spanner fornendo un livello.
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione RAG Engine.
- Fai clic sull'opzione Passa a Spanner. Potrebbe non essere visibile se sei in modalità Spanner. Puoi verificare la modalità attuale dall'etichetta della modalità.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Leggere la configurazione RagEngineConfig corrente
I seguenti esempi di codice mostrano come leggere RagEngineConfig per vedere la modalità e il livello scelti:
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config = rag.rag_data.get_rag_engine_config(
name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
)
print(rag_engine_config)
Aggiornare il livello in modalità Spanner
I seguenti esempi di codice mostrano come aggiornare il livello in modalità Spanner:
Aggiornare RagEngineConfig al livello con scalabilità della modalità Spanner
I seguenti esempi di codice mostrano come impostare RagEngineConfig sulla modalità Spanner con il livello con scalabilità:
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione RAG Engine.
- Fai clic sull'opzione Passa a Spanner se non sei già in modalità Spanner.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine.
- Seleziona il livello con cui vuoi eseguire RAG Engine.
- Fai clic su Salva.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'scaled': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Scaled())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Aggiornare RagEngineConfig alla modalità Spanner con il livello di base
I seguenti esempi di codice mostrano come impostare RagEngineConfig sulla modalità Spanner con il livello di base:
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione RAG Engine.
- Fai clic sull'opzione Passa a Spanner se non sei già in modalità Spanner.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine.
- Seleziona il livello con cui vuoi eseguire RAG Engine.
- Fai clic su Salva.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'basic': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Basic())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Aggiornare RagEngineConfig al livello senza provisioning
I seguenti esempi di codice mostrano come impostare RagEngineConfig sulla modalità Spanner con il livello senza provisioning. Verranno eliminati definitivamente tutti i dati dalla modalità di deployment Spanner e verranno interrotte le spese di fatturazione derivanti da questa modalità.
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione RAG Engine.
- Fai clic sull'opzione Passa a Spanner se non sei già in modalità Spanner.
- Fai clic su Elimina RAG Engine. Viene visualizzata una finestra di dialogo di conferma.
- Verifica che stai per eliminare i dati in RAG Engine inserendo delete.
- Fai clic su Conferma.
- Fai clic su Salva.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'unprovisioned': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Agent Platform API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Unprovisioned())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)