Zwischen Modi wechseln

Bereitstellungsmodi sind eine Konfiguration auf Projektebene. Wenn Sie zwischen den beiden Modi wechseln, werden Ihre Daten nicht aus dem anderen Modus verschoben oder gelöscht. Mit der UpdateRagEngineConfig API können Sie zwischen dem serverlosen und dem Cloud Spanner-Bereitstellungsmodus wechseln. Sie können diese API auch verwenden, um die Stufe für den Cloud Spanner-Bereitstellungsmodus festzulegen oder den Cloud Spanner-Modus aufzuheben, um die Abrechnung zu beenden. Mit der GetRagEngineConfig API können Sie Informationen zu Ihrem aktuellen Bereitstellungsmodus lesen.

Zum serverlosen Modus wechseln

Die folgenden Codebeispiele zeigen, wie Sie Ihre RagEngineConfig in den serverlosen Modus wechseln:

Console

  1. Rufen Sie in der Google Cloud Console die Seite RAG Engine auf.

    Zur RAG Engine

  2. Wählen Sie die Region aus, in der Ihre Vertex AI RAG Engine ausgeführt wird.
  3. Klicken Sie auf die Option Zum serverlosen Modus wechseln. Sie ist möglicherweise nicht sichtbar, wenn Sie sich im serverlosen Modus befinden. Sie können Ihren aktuellen Modus anhand der Modusbezeichnung oben rechts auf der Seite überprüfen.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'serverless': {}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Serverless()),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

Zum Cloud Spanner-Modus wechseln

Die folgenden Codebeispiele zeigen, wie Sie Ihre RagEngineConfig in den Cloud Spanner-Modus wechseln. Wenn Sie den Cloud Spanner-Modus bereits verwendet und eine Stufe ausgewählt haben, müssen Sie diese beim Wechsel nicht explizit angeben. Andernfalls finden Sie in den folgenden Codebeispielen Informationen zum Wechsel in den Cloud Spanner-Modus mit Angabe einer Stufe.

Console

  1. Rufen Sie in der Google Cloud Console die Seite RAG Engine auf.

    Zur RAG Engine

  2. Wählen Sie die Region aus, in der Ihre Vertex AI RAG Engine ausgeführt wird.
  3. Klicken Sie auf die Option Zum Cloud Spanner-Modus wechseln. Sie ist möglicherweise nicht sichtbar, wenn Sie sich im Cloud Spanner-Modus befinden. Sie können Ihren aktuellen Modus anhand der Modusbezeichnung überprüfen.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner()),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

Aktuelle RagEngineConfig lesen

Die folgenden Codebeispiele zeigen, wie Sie Ihre RagEngineConfig lesen, um den ausgewählten Modus und die ausgewählte Stufe zu sehen:

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config = rag.rag_data.get_rag_engine_config(
    name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
)

print(rag_engine_config)

Stufe im Cloud Spanner-Modus aktualisieren

Die folgenden Codebeispiele zeigen, wie Sie die Stufe im Cloud Spanner-Modus aktualisieren:

RagEngineConfig auf Cloud Spanner-Modus mit Stufe „Skaliert“ aktualisieren

Die folgenden Codebeispiele zeigen, wie Sie die RagEngineConfig auf den Cloud Spanner-Modus mit der Stufe „Skaliert“ festlegen:

Console

  1. Rufen Sie in der Google Cloud Console die Seite RAG Engine auf.

    Zur RAG Engine

  2. Wählen Sie die Region aus, in der Ihre Vertex AI RAG Engine ausgeführt wird.
  3. Klicken Sie auf die Option Zum Cloud Spanner-Modus wechseln, wenn Sie sich noch nicht im Cloud Spanner-Modus befinden.
  4. Klicken Sie auf RAG Engine konfigurieren. Der Bereich RAG Engine konfigurieren wird angezeigt.
  5. Wählen Sie die Stufe aus, mit der Sie Ihre RAG Engine ausführen möchten.
  6. Klicken Sie auf Speichern.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'scaled': {}}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Scaled())),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

RagEngineConfig auf Cloud Spanner-Modus mit Stufe „Basic“ aktualisieren

Die folgenden Codebeispiele zeigen, wie Sie die RagEngineConfig auf den Cloud Spanner-Modus mit der Stufe „Basic“ festlegen:

Console

  1. Rufen Sie in der Google Cloud Console die Seite RAG Engine auf.

    Zur RAG Engine

  2. Wählen Sie die Region aus, in der Ihre Vertex AI RAG Engine ausgeführt wird.
  3. Klicken Sie auf die Option Zum Cloud Spanner-Modus wechseln, wenn Sie sich noch nicht im Cloud Spanner-Modus befinden.
  4. Klicken Sie auf RAG Engine konfigurieren. Der Bereich RAG Engine konfigurieren wird angezeigt.
  5. Wählen Sie die Stufe aus, mit der Sie Ihre RAG Engine ausführen möchten.
  6. Klicken Sie auf Speichern.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'basic': {}}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Basic())),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)

RagEngineConfig auf Stufe „Nicht bereitgestellt“ aktualisieren

Die folgenden Codebeispiele zeigen, wie Sie die RagEngineConfig auf den Cloud Spanner-Modus mit der Stufe „Nicht bereitgestellt“ festlegen. Dadurch werden alle Daten aus Ihrem Cloud Spanner-Bereitstellungsmodus dauerhaft gelöscht und die Abrechnung dafür beendet.

Console

  1. Rufen Sie in der Google Cloud Console die Seite RAG Engine auf.

    Zur RAG Engine

  2. Wählen Sie die Region aus, in der Ihre Vertex AI RAG Engine ausgeführt wird.
  3. Klicken Sie auf die Option Zum Cloud Spanner-Modus wechseln, wenn Sie sich noch nicht im Cloud Spanner-Modus befinden.
  4. Klicken Sie auf RAG Engine löschen. Ein Bestätigungsdialog erscheint.
  5. Bestätigen Sie, dass Sie Ihre Daten in der Vertex AI RAG Engine löschen möchten, indem Sie delete eingeben.
  6. Klicken Sie auf Bestätigen.
  7. Klicken Sie auf Speichern.

REST

PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/ragEngineConfig -d "{'ragManagedDbConfig': {'spanner': {'unprovisioned': {}}}}"

Python

from vertexai.preview import rag
import vertexai

PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION

# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)

rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"

new_rag_engine_config = rag.RagEngineConfig(
    name=rag_engine_config_name,
    rag_managed_db_config=rag.RagManagedDbConfig(mode=rag.Spanner(tier=rag.Unprovisioned())),
)

updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
    rag_engine_config=new_rag_engine_config
)

print(updated_rag_engine_config)