Le modalità di deployment sono una configurazione a livello di progetto. Il passaggio da una modalità all'altra non sposta né elimina i dati dall'altra modalità. Puoi utilizzare l'API UpdateRagEngineConfig per passare dalla modalità di deployment serverless a quella Spanner e viceversa. Puoi anche utilizzare questa API per impostare il livello nella modalità di deployment Spanner o per annullare il provisioning della modalità Spanner per interrompere la fatturazione. Puoi utilizzare l'API GetRagEngineConfig per leggere le informazioni sulla modalità di deployment corrente.
Passare alla modalità serverless
I seguenti esempi di codice mostrano come impostare RagEngineConfig in modalità serverless:
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione Vertex AI RAG Engine.
- Fai clic sull'opzione Passa a serverless. Potrebbe non essere visibile se sei in modalità serverless. Puoi verificare la modalità attuale dall'etichetta della modalità nella sezione in alto a destra della pagina.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'serverless': {}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Serverless()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Passare alla modalità Spanner
I seguenti esempi di codice mostrano come impostare RagEngineConfig in modalità Spanner. Se hai già utilizzato la modalità Spanner e hai scelto un livello, non devi specificarlo esplicitamente durante il passaggio. In caso contrario, consulta gli esempi di codice riportati di seguito per scoprire come passare alla modalità Spanner fornendo un livello.
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione Vertex AI RAG Engine.
- Fai clic sull'opzione Passa a Spanner. Potrebbe non essere visibile se sei in modalità Spanner. Puoi verificare la modalità attuale dall'etichetta della modalità.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Leggere l'attuale RagEngineConfig
I seguenti esempi di codice mostrano come leggere RagEngineConfig per vedere la modalità e il livello scelti:
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config = rag.rag_data.get_rag_engine_config(
name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
)
print(rag_engine_config)
Aggiornare il livello in modalità Spanner
I seguenti esempi di codice mostrano come aggiornare il livello in modalità Spanner:
Aggiornare RagEngineConfig al livello scalabile della modalità Spanner
I seguenti esempi di codice mostrano come impostare RagEngineConfig in modalità Spanner con il livello scalabile:
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione Vertex AI RAG Engine.
- Fai clic sull'opzione Passa a Spanner se non sei già in modalità Spanner.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine.
- Seleziona il livello con cui vuoi eseguire RAG Engine.
- Fai clic su Salva.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'scaled': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Scaled())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Aggiornare RagEngineConfig alla modalità Spanner con il livello di base
I seguenti esempi di codice mostrano come impostare RagEngineConfig in modalità Spanner con il livello di base:
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione Vertex AI RAG Engine.
- Fai clic sull'opzione Passa a Spanner se non sei già in modalità Spanner.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine.
- Seleziona il livello con cui vuoi eseguire RAG Engine.
- Fai clic su Salva.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'basic': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Basic())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
Aggiornare RagEngineConfig al livello di cui non è stato eseguito il provisioning
I seguenti esempi di codice mostrano come impostare RagEngineConfig in modalità Spanner con il livello di cui non è stato eseguito il provisioning. Verranno eliminati definitivamente tutti i dati dalla modalità di deployment Spanner e verranno interrotte le spese di fatturazione derivanti da questa modalità.
Console
- Nella Google Cloud console, vai alla pagina RAG Engine.
- Seleziona la regione in cui è in esecuzione Vertex AI RAG Engine.
- Fai clic sull'opzione Passa a Spanner se non sei già in modalità Spanner.
- Fai clic su Elimina RAG Engine. Viene visualizzata una finestra di dialogo di conferma.
- Verifica di voler eliminare i dati in Vertex AI RAG Engine inserendo delete.
- Fai clic su Conferma.
- Fai clic su Salva.
REST
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'unprovisioned': {}}}}"
Python
from vertexai.preview import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Unprovisioned())),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)