Cloud Spanner-Modus verwalten

Im Spanner-Bereitstellungsmodus verwendet die Vertex AI RAG Engine RagManagedDb. Das ist eine unternehmensfertige, vollständig verwaltete Google Cloud Spanner-Instanz, die von der Vertex AI RAG Engine für die Ressourcenspeicherung verwendet wird. Optional können Sie sie als Vektordatenbank Ihrer Wahl für Ihre RAG-Korpora verwenden.

Über Spanner bietet die Vertex AI RAG Engine eine konsistente, hochverfügbare und hochskalierbare dedizierte Datenbank zur Unterstützung Ihrer Anwendung. Weitere Informationen zu Google Cloud Spanner finden Sie unter Spanner.

Die Vertex AI RAG Engine speichert Ihre RAG-Korpus- und RAG-Dateiressourcen-Metadaten in RagManagedDb, unabhängig von Ihrer Wahl der Vektordatenbank. Vektordatenbanken werden nur zum Speichern und Abrufen von Einbettungen verwendet. Zusätzlich zur Ressourcenspeicherung kann RagManagedDb auch zum Speichern und Verwalten von Vektordarstellungen Ihrer Dokumente verwendet werden. Die Vektordatenbank wird dann verwendet, um relevante Dokumente basierend auf der semantischen Ähnlichkeit des Dokuments mit einer bestimmten Abfrage abzurufen.

Verfügbare Stufen

Mit der Vertex AI RAG Engine können Sie Ihre RagManagedDb-Instanz basierend auf Ihren Nutzungs- und Leistungsanforderungen mit zwei Stufen skalieren. Mit einer dritten Stufe können Sie auch Ihre Vertex AI RAG Engine-Daten löschen.

Die Stufe ist eine Einstellung auf Projektebene, die in der RagEngineConfig-Ressource verfügbar ist und sich auf RAG-Korpora auswirkt, die RagManagedDb verwenden. Die folgenden Stufen sind in RagEngineConfig verfügbar:

  • Skalierte Stufe:Diese Stufe bietet Leistung auf Produktionsniveau sowie eine Autoscaling-Funktion. Sie eignet sich für Kunden mit großen Datenmengen oder leistungsempfindlichen Arbeitslasten. Intern wird bei dieser Stufe die Spanner-Instanz auf die Autoscaling-Konfiguration mit mindestens einem Knoten (1.000 Verarbeitungseinheiten) und maximal zehn Knoten (10.000 Verarbeitungseinheiten) festgelegt.

  • Einfache Stufe (Standard) : Diese Stufe bietet eine kostengünstige und rechenarme Stufe, die in einigen der folgenden Fälle geeignet sein kann:

    • Testen von RagManagedDb
    • Kleine Datengrößen
    • Latenzunempfindliche Arbeitslasten
    • Verwenden der Vertex AI RAG Engine nur mit anderen Vektordatenbanken

Um die einfache Stufe anzubieten, legt RagManagedDb die zugrunde liegende Spanner-Instanz auf eine feste Konfiguration von 100 Verarbeitungseinheiten fest, was 0,1 Knoten entspricht.

  • Nicht bereitgestellte Stufe:Bei dieser Stufe werden RagManagedDb und die zugrunde liegende Spanner-Instanz gelöscht. Die nicht bereitgestellte Stufe deaktiviert den Vertex AI RAG Engine-Dienst und löscht Ihre Daten, die in diesem Dienst gespeichert sind, unabhängig von der Vektordatenbank, die für Ihre RagCorpora verwendet wird. Dadurch wird die Abrechnung des Dienstes beendet. Weitere Informationen zur Abrechnung finden Sie unter Abrechnung der Vertex AI RAG Engine.

Nachdem die Daten gelöscht wurden, können sie nicht wiederhergestellt werden. Wenn Sie die Vertex AI RAG Engine wieder verwenden möchten, müssen Sie die Stufe aktualisieren, indem Sie die UpdateRagEngineConfig API aufrufen oder den Modus auf „Serverlos“ umstellen.

Stufen verwalten

Verwenden Sie die APIs GetRagEngineConfig und UpdateRagEngineConfig, um Ihre Stufen zu lesen und zu aktualisieren. Codebeispiele zur Verwendung dieser APIs finden Sie auf der Seite Zwischen Modi wechseln.