Auf dieser Seite werden RagManagedDb, die zugrunde liegende Technologie und die Verwendung von RagManagedDb in der Vertex AI RAG Engine vorgestellt. Außerdem werden die verschiedenen Stufen beschrieben, mit denen Sie die Leistung optimieren können, was sich auf Ihre Kosten auswirken kann. Außerdem finden Sie eine Anleitung zum Löschen Ihrer Vertex AI RAG Engine-Daten, wodurch die Abrechnung beendet wird.
Übersicht
Die Vertex AI RAG Engine verwendet RagManagedDb, eine unternehmensfertige,
vollständig verwaltete Google Spanner-Instanz, die für die Ressourcenspeicherung verwendet wird
von der Vertex AI RAG Engine und ist optional verfügbar, um als
die Vektordatenbank der
Wahl für Ihre RAG-Corpora verwendet zu werden.
Über Spanner bietet die Vertex AI RAG Engine eine konsistente, hochverfügbare und hochskalierbare Datenbank zur Unterstützung Ihrer Anwendung. Weitere Informationen zu Google Spanner finden Sie unter Spanner.
Die Vertex AI RAG Engine speichert die Metadaten Ihres RAG-Corpus und Ihrer RAG-Dateiressourcen in RagManagedDb, unabhängig von Ihrer Wahl der Vektordatenbank. Vektordatenbanken werden nur zum Speichern und Abrufen von Einbettungen verwendet. Neben der Ressourcenspeicherung kann RagManagedDb auch zum Speichern und Verwalten von Vektordarstellungen Ihrer Dokumente verwendet werden. Die Vektordatenbank wird dann verwendet, um relevante Dokumente basierend auf der semantischen Ähnlichkeit des Dokuments mit einer bestimmten Abfrage abzurufen.
Stufen verwalten
Mit der Vertex AI RAG Engine können Sie Ihre RagManagedDb-Instanz basierend auf Ihren Nutzungs- und Leistungsanforderungen mit zwei Stufen skalieren und optional Ihre Vertex AI RAG Engine-Daten mit einer dritten Stufe löschen.
Die Stufe ist eine Einstellung auf Projektebene, die in der Ressource RagEngineConfig verfügbar ist und sich auf RAG-Corpora auswirkt, die RagManagedDb verwenden. Die folgenden Stufen sind in RagEngineConfig verfügbar:
Skalierte Stufe: Diese Stufe bietet Leistung auf Produktionsniveau sowie eine Autoscaling-Funktion. Sie eignet sich für Kunden mit großen Datenmengen oder leistungsempfindlichen Arbeitslasten. Intern wird bei dieser Stufe die Spanner-Instanz auf die Autoscaling-Konfiguration mit mindestens einem Knoten (1.000 Verarbeitungseinheiten) und maximal zehn Knoten (10.000 Verarbeitungseinheiten) festgelegt.
Einfache Stufe (Standard): Diese Stufe bietet eine kostengünstige und rechenarme Stufe, die für einige der folgenden Fälle geeignet sein kann:
- Testen von
RagManagedDb. - Kleine Datengröße.
- Arbeitslast, die nicht auf Latenz reagiert.
- Verwenden der Vertex AI RAG Engine nur mit anderen Vektordatenbanken.
Um die einfache Stufe anzubieten, legt
RagManagedDbdie zugrunde liegende Spanner-Instanz auf eine feste Konfiguration von 100 Verarbeitungseinheiten fest, was 0,1 Knoten entspricht.- Testen von
Nicht bereitgestellte Stufe: Bei dieser Stufe werden
RagManagedDbund die zugrunde liegende Spanner-Instanz gelöscht. Die nicht bereitgestellte Stufe deaktiviert den Vertex AI RAG Engine-Dienst und löscht Ihre Daten, die in diesem Dienst gespeichert sind, unabhängig von der Vektordatenbank, die für IhreRagCorporaverwendet wird. Dadurch wird die Abrechnung des Dienstes beendet. Weitere Informationen zur Abrechnung finden Sie unter [Vertex AI RAG Engine-Abrechnung]rag-engine-billing).Nach dem Löschen können die Daten nicht wiederhergestellt werden. Wenn Sie die Vertex AI RAG Engine wieder verwenden möchten, müssen Sie die Stufe aktualisieren, indem Sie die
UpdateRagEngineConfigAPI aufrufen.
Projektkonfiguration abrufen
Die folgenden Codebeispiele zeigen, wie die GetRagEngineConfig API für die einzelnen Stufentypen verwendet wird:
Codebeispiele für die Version 1 (v1) der API.
v1beta1 API Codebeispiele.
Projektkonfiguration aktualisieren
Die folgenden Codebeispiele zeigen, wie die UpdateRagEngineConfig API für die einzelnen Stufentypen verwendet wird:
Codebeispiele für die Version 1 (v1) der API.
v1beta1 Codebeispiele für die API.
Nächste Schritte
Informationen zur Verwendung der RAG API v1, der Standardversion, finden Sie unter RAG API v1.
Informationen zur Verwendung der RAG API v1beta1 finden Sie unter RAG API v1beta1.
Weitere Informationen zu
RagManagedDbund zum Verwalten der Stufenkonfiguration sowie der Abrufstrategie auf RAG-Corpus-Ebene finden Sie unter RagManagedDb mit der Vertex AI RAG Engine verwenden.