Cloud Spanner-Modus verwalten

Im Spanner-Bereitstellungsmodus verwendet die RAG Engine RagManagedDb. Das ist eine unternehmenstaugliche, vollständig verwaltete Google Cloud Spanner-Instanz, die von der RAG Engine in der Gemini Enterprise Agent Platform zum Speichern von Ressourcen verwendet wird. Optional können Sie sie als Vektordatenbank Ihrer Wahl für Ihre RAG-Korpora verwenden.

Über Spanner bietet die RAG Engine eine konsistente, hochverfügbare und hoch skalierbare dedizierte Datenbank zur Unterstützung Ihrer Anwendung. Weitere Informationen zu Google Cloud Spanner finden Sie unter Spanner.

Die RAG Engine speichert die Metadaten Ihres RAG-Korpus und Ihrer RAG-Dateiressourcen in RagManagedDb, unabhängig von Ihrer Wahl der Vektordatenbank. Vektordatenbanken werden nur zum Speichern und Abrufen von Einbettungen verwendet. Neben der Ressourcenspeicherung kann RagManagedDb auch zum Speichern und Verwalten von Vektordarstellungen Ihrer Dokumente verwendet werden. Die Vektordatenbank wird dann verwendet, um relevante Dokumente basierend auf der semantischen Ähnlichkeit des Dokuments mit einer bestimmten Abfrage abzurufen.

Verfügbare Stufen

Mit der RAG Engine können Sie Ihre RagManagedDb-Instanz basierend auf Ihren Nutzungs- und Leistungsanforderungen mit zwei Stufen skalieren. Mit einer dritten Stufe können Sie auch Ihre RAG Engine-Daten löschen.

Die Stufe ist eine Einstellung auf Projektebene, die in der Ressource RagEngineConfig verfügbar ist und sich auf RAG-Korpora auswirkt, die RagManagedDb verwenden. Die folgenden Stufen sind in RagEngineConfig verfügbar:

  • Skalierte Stufe:Diese Stufe bietet Leistung auf Produktionsniveau sowie eine Autoscaling-Funktion. Sie eignet sich für Kunden mit großen Datenmengen oder leistungsempfindlichen Arbeitslasten. Intern wird bei dieser Stufe die Spanner-Instanz auf die Autoscaling-Konfiguration mit mindestens einem Knoten (1.000 Verarbeitungseinheiten) und maximal zehn Knoten (10.000 Verarbeitungseinheiten) festgelegt.

  • Einfache Stufe (Standard) : Diese Stufe bietet eine kostengünstige und rechenarme Stufe, die in einigen der folgenden Fälle geeignet sein kann:

    • Testen von RagManagedDb
    • Kleine Datenmengen
    • Latenzunempfindliche Arbeitslasten
    • Verwenden der RAG Engine nur mit anderen Vektordatenbanken

Um die einfache Stufe anzubieten, legt RagManagedDb die zugrunde liegende Spanner-Instanz auf eine feste Konfiguration von 100 Verarbeitungseinheiten fest, was 0,1 Knoten entspricht.

  • Nicht bereitgestellte Stufe:Bei dieser Stufe werden RagManagedDb und die zugrunde liegende Spanner-Instanz gelöscht. Bei der nicht bereitgestellten Stufe wird der RAG Engine-Dienst deaktiviert und Ihre Daten in diesem Dienst gelöscht, unabhängig von der Vektordatenbank, die für Ihre RagCorpora verwendet wird. Dadurch wird die Abrechnung des Dienstes beendet. Weitere Informationen zur Abrechnung finden Sie unter Abrechnung der RAG Engine in der Gemini Enterprise Agent Platform.

Nachdem die Daten gelöscht wurden, können sie nicht wiederhergestellt werden. Wenn Sie die RAG Engine wieder verwenden möchten, müssen Sie die Stufe aktualisieren, indem Sie die UpdateRagEngineConfig API aufrufen oder den Modus auf „Serverlos“ umstellen.

Stufen verwalten

Verwenden Sie die APIs GetRagEngineConfig und UpdateRagEngineConfig, um Ihre Stufen zu lesen und zu aktualisieren. Codebeispiele zur Verwendung dieser APIs finden Sie auf der Seite Zwischen Modi wechseln.