Im Spanner-Bereitstellungsmodus verwendet RAG Engine RagManagedDb, eine für Unternehmen geeignete, vollständig verwaltete Google Cloud Spanner-Instanz, die von RAG Engine auf der Gemini Enterprise Agent Platform zum Speichern von Ressourcen verwendet wird. Sie können sie optional als Vektordatenbank für Ihre RAG-Korpora verwenden.
Mit Spanner bietet RAG Engine eine konsistente, hochverfügbare und hoch skalierbare dedizierte Datenbank zur Unterstützung Ihrer Anwendung. Weitere Informationen zu Google Cloud Spanner finden Sie unter Spanner.
Datenspeicherung und Vektorsuche
Die RAG Engine speichert Ihre RAG-Corpus- und RAG-Dateiressourcenmetadaten in RagManagedDb, unabhängig von Ihrer Auswahl der Vektordatenbank. Vektordatenbanken werden nur zum Speichern und Abrufen von Einbettungen verwendet. Neben der Speicherung von Ressourcen kann RagManagedDb auch zum Speichern und Verwalten von Vektordarstellungen Ihrer Dokumente verwendet werden. Die Vektordatenbank wird dann verwendet, um relevante Dokumente basierend auf der semantischen Ähnlichkeit des Dokuments mit einer bestimmten Anfrage abzurufen.
Verfügbare Stufen
Mit RAG Engine können Sie Ihre RagManagedDb-Instanz basierend auf Ihren Nutzungs- und Leistungsanforderungen mit zwei Stufen skalieren. Sie können damit auch Ihre RAG Engine-Daten mit einer dritten Ebene löschen.
Die Stufe ist eine Einstellung auf Projektebene, die in der RagEngineConfig-Ressource verfügbar ist und sich auf RAG-Korpora auswirkt, die RagManagedDb verwenden. Die folgenden Stufen sind in RagEngineConfig verfügbar:
Skalierte Stufe:Diese Stufe bietet Leistung auf Produktionsniveau sowie Autoscaling-Funktionen. Es eignet sich für Kunden mit großen Datenmengen oder leistungsempfindlichen Arbeitslasten. Intern wird bei dieser Stufe die Spanner-Instanz auf die Autoscaling-Konfiguration mit mindestens einem Knoten (1.000 Verarbeitungseinheiten) und maximal zehn Knoten (10.000 Verarbeitungseinheiten) festgelegt.
Basic-Stufe (Standard): Diese Stufe ist kostengünstig und rechenarm und eignet sich möglicherweise für einige der folgenden Fälle:
- Test läuft mit
RagManagedDb - Kleine Datengrößen
- Arbeitslasten, die nicht auf Latenz reagieren
- RAG Engine nur mit anderen Vektordatenbanken verwenden
- Test läuft mit
Für die Basis-Stufe legt RagManagedDb die zugrunde liegende Spanner-Instanz auf eine feste Konfiguration von 100 Verarbeitungseinheiten fest, was 0, 1 Knoten entspricht.
- Nicht bereitgestellte Stufe:Auf dieser Stufe werden die
RagManagedDbund die zugrunde liegende Spanner-Instanz gelöscht. Im Tarif „Nicht bereitgestellt“ wird der RAG Engine-Dienst deaktiviert und Ihre in diesem Dienst gespeicherten Daten werden gelöscht, unabhängig von der Vektordatenbank, die für IhrRagCorporaverwendet wird. Dadurch wird die Abrechnung des Dienstes beendet. Weitere Informationen zur Abrechnung finden Sie unter Abrechnung der RAG Engine.
Nach dem Löschen können die Daten nicht mehr wiederhergestellt werden. Wenn Sie RAG Engine wieder verwenden möchten, müssen Sie das Tier aktualisieren, indem Sie die UpdateRagEngineConfig API aufrufen, oder den Modus auf „Serverless“ umstellen.
Stufen verwalten
Verwenden Sie die GetRagEngineConfig- und UpdateRagEngineConfig-API, um Ihre Stufen zu lesen und zu aktualisieren. Auf der Seite Zwischen Modi wechseln finden Sie Codebeispiele für die Verwendung dieser APIs.