Auf dieser Seite werden die Preise und die Abrechnung der RAG Engine auf der Gemini Enterprise Agent Platform beschrieben. Sie basieren auf den Komponenten der RAG Engine auf der Gemini Enterprise Agent Platform, die Sie verwenden, z. B. Modelle, Reranking und Vektorspeicher.
Weitere Informationen finden Sie auf der RAG Engine auf der Gemini Enterprise Agent Platform Übersichtsseite.
Preise und Abrechnung
In dieser Tabelle wird erläutert, wie die Abrechnung funktioniert, wenn Sie die RAG-Komponenten verwenden.
| Komponente | Abrechnung bei Verwendung der RAG Engine |
|---|---|
| Datenaufnahme | Die RAG Engine unterstützt die Aufnahme von Daten aus verschiedenen Datenquellen. Beispiel: Hochladen lokaler Dateien, Cloud Storage und Google Drive. Der Zugriff auf Dateien in diesen Daten quellen über die RAG Engine ist kostenlos. Für die Daten übertragung können jedoch Gebühren anfallen. Beispiel: Kosten für ausgehenden Traffic. |
| Daten Transformation (Dateianalyse) |
|
| Datentransformation (Datei aufteilung) | Unterstützt die Aufteilung in Blöcke mit fester Größe, die kostenlos ist. |
| Generierung von Einbettungen |
Die RAG Engine orchestriert die Generierung von Einbettungen mit dem von Ihnen angegebenen Einbettungsmodell. Die Kosten für dieses Modell werden Ihrem Projekt in Rechnung gestellt. Weitere Informationen zu den Preisen finden Sie unter Kosten für das Erstellen und Bereitstellen von KI-Modellen auf der Gemini Enterprise Agent Platform. |
| Datenindexierung und -abruf |
Die RAG Engine unterstützt zwei Kategorien von Vektordatenbanken für die Vektor Suche:
Eine von RAG verwaltete Datenbank hat zwei Zwecke:
Eine von RAG verwaltete Datenbank verwendet eine Cloud Spanner-Instanz als Backend. Für jedes Ihrer Projekte stellt die RAG Engine ein kundenspezifisches Google Cloud Projekt bereit und verwaltet von RAG verwaltete Ressourcen, die in der RAG Engine gespeichert sind, damit Ihre Daten physisch isoliert sind.
Wenn Sie die Dienststufe „Basic“ oder „Scaled“ von
Wenn ein RAG-Korpus in Ihrem Projekt eine von RAG verwaltete Datenbank für die Vektorsuche verwendet, wird Ihnen die von RAG verwaltete Cloud Spanner-Instanz in Rechnung gestellt. Die RAG Engine überträgt die Cloud Spanner Kosten aus dem entsprechenden von RAG verwalteten Projekt in Ihr Google Cloud Projekt, sodass Sie die Kosten für die Cloud Spanner-Instanz sehen und bezahlen können. Weitere Informationen zu den Preisen für Cloud Spanner finden Sie unter Cloud Spanner-Preise. |
| Reranking für die RAG Engine auf der Gemini Enterprise Agent Platform |
Die folgenden Ranking-Tools werden nach dem Abruf unterstützt:
|
RAG Engine löschen
Die folgenden Codebeispiele zeigen, wie Sie eine RAG Engine für die Google Cloud Konsole, Python und REST löschen:
API Parameter und Code beispiele für Version 1 (v1).
API Parameter und Code beispiele für v1beta1.
Nächste Schritte
Informationen zur Verwendung des Vertex AI SDK zum Ausführen von RAG Engine-Aufgaben auf der Gemini Enterprise Agent Platform finden Sie unter RAG-Schnellstart für Python.
Weitere Informationen zur Fundierung finden Sie unter Fundierungs übersicht.
Weitere Informationen zu den Antworten von RAG finden Sie unter Abruf- und Generierung Ausgabe der RAG Engine.
Informationen zur RAG-Architektur: