RagManagedDb

Auf dieser Seite werden RagManagedDb, die zugrunde liegende Technologie und die Verwendung von RagManagedDb in der Vertex AI RAG Engine vorgestellt. Außerdem werden die verschiedenen Stufen beschrieben, mit denen Sie die Leistung optimieren können, was sich auf Ihre Kosten auswirken kann. Außerdem finden Sie eine Anleitung zum Löschen Ihrer Vertex AI RAG Engine-Daten, wodurch die Abrechnung beendet wird.

Übersicht

Die Vertex AI RAG Engine verwendet RagManagedDb, eine unternehmensfertige, vollständig verwaltete Google Spanner-Instanz, die für die Ressourcenspeicherung verwendet wird von der Vertex AI RAG Engine und ist optional verfügbar, um als die Vektordatenbank der Wahl für Ihre RAG-Corpora verwendet zu werden.

Über Spanner bietet die Vertex AI RAG Engine eine konsistente, hochverfügbare und hochskalierbare Datenbank zur Unterstützung Ihrer Anwendung. Weitere Informationen zu Google Spanner finden Sie unter Spanner.

Die Vertex AI RAG Engine speichert die Metadaten Ihres RAG-Corpus und Ihrer RAG-Dateiressourcen in RagManagedDb, unabhängig von Ihrer Wahl der Vektordatenbank. Vektordatenbanken werden nur zum Speichern und Abrufen von Einbettungen verwendet. Neben der Ressourcenspeicherung kann RagManagedDb auch zum Speichern und Verwalten von Vektordarstellungen Ihrer Dokumente verwendet werden. Die Vektordatenbank wird dann verwendet, um relevante Dokumente basierend auf der semantischen Ähnlichkeit des Dokuments mit einer bestimmten Abfrage abzurufen.

Stufen verwalten

Mit der Vertex AI RAG Engine können Sie Ihre RagManagedDb-Instanz basierend auf Ihren Nutzungs- und Leistungsanforderungen mit zwei Stufen skalieren und optional Ihre Vertex AI RAG Engine-Daten mit einer dritten Stufe löschen.

Die Stufe ist eine Einstellung auf Projektebene, die in der Ressource RagEngineConfig verfügbar ist und sich auf RAG-Corpora auswirkt, die RagManagedDb verwenden. Die folgenden Stufen sind in RagEngineConfig verfügbar:

  • Skalierte Stufe: Diese Stufe bietet Leistung auf Produktionsniveau sowie eine Autoscaling-Funktion. Sie eignet sich für Kunden mit großen Datenmengen oder leistungsempfindlichen Arbeitslasten. Intern wird bei dieser Stufe die Spanner-Instanz auf die Autoscaling-Konfiguration mit mindestens einem Knoten (1.000 Verarbeitungseinheiten) und maximal zehn Knoten (10.000 Verarbeitungseinheiten) festgelegt.

  • Einfache Stufe (Standard): Diese Stufe bietet eine kostengünstige und rechenarme Stufe, die für einige der folgenden Fälle geeignet sein kann:

    • Testen von RagManagedDb.
    • Kleine Datengröße.
    • Arbeitslast, die nicht auf Latenz reagiert.
    • Verwenden der Vertex AI RAG Engine nur mit anderen Vektordatenbanken.

    Um die einfache Stufe anzubieten, legt RagManagedDb die zugrunde liegende Spanner-Instanz auf eine feste Konfiguration von 100 Verarbeitungseinheiten fest, was 0,1 Knoten entspricht.

  • Nicht bereitgestellte Stufe: Bei dieser Stufe werden RagManagedDb und die zugrunde liegende Spanner-Instanz gelöscht. Die nicht bereitgestellte Stufe deaktiviert den Vertex AI RAG Engine-Dienst und löscht Ihre Daten, die in diesem Dienst gespeichert sind, unabhängig von der Vektordatenbank, die für Ihre RagCorpora verwendet wird. Dadurch wird die Abrechnung des Dienstes beendet. Weitere Informationen zur Abrechnung finden Sie unter [Vertex AI RAG Engine-Abrechnung]rag-engine-billing).

    Nach dem Löschen können die Daten nicht wiederhergestellt werden. Wenn Sie die Vertex AI RAG Engine wieder verwenden möchten, müssen Sie die Stufe aktualisieren, indem Sie die UpdateRagEngineConfig API aufrufen.

Projektkonfiguration abrufen

Die folgenden Codebeispiele zeigen, wie die GetRagEngineConfig API für die einzelnen Stufentypen verwendet wird:

Projektkonfiguration aktualisieren

Die folgenden Codebeispiele zeigen, wie die UpdateRagEngineConfig API für die einzelnen Stufentypen verwendet wird:

Nächste Schritte