Abrechnung der RAG Engine auf der Gemini Enterprise Agent Platform

Auf dieser Seite werden die Preise und die Abrechnung der RAG Engine auf der Gemini Enterprise Agent Platform beschrieben. Sie basieren auf den Komponenten der RAG Engine auf der Gemini Enterprise Agent Platform, die Sie verwenden, z. B. Modelle, Reranking und Vektorspeicher.

Weitere Informationen finden Sie auf der RAG Engine auf der Gemini Enterprise Agent Platform Übersichtsseite.

Preise und Abrechnung

In dieser Tabelle wird erläutert, wie die Abrechnung funktioniert, wenn Sie die RAG-Komponenten verwenden.

Komponente Abrechnung bei Verwendung der RAG Engine
Datenaufnahme Die RAG Engine unterstützt die Aufnahme von Daten aus verschiedenen Datenquellen. Beispiel: Hochladen lokaler Dateien, Cloud Storage und Google Drive. Der Zugriff auf Dateien in diesen Daten quellen über die RAG Engine ist kostenlos. Für die Daten übertragung können jedoch Gebühren anfallen. Beispiel: Kosten für ausgehenden Traffic.
Daten Transformation (Dateianalyse)
  • Standardparser: Kostenlos.
  • LLM-Parser: Die RAG Engine verwendet das von Ihnen angegebene LLM-Modell, um Ihre Datei zu analysieren. Die Kosten für das LLM-Modell werden direkt über Ihr Projekt abgerechnet.
  • Document AI Layoutparser: Die RAG Engine verwendet den von Ihnen angegebenen Document AI-Layoutparser, um Ihre Datei zu verarbeiten. Die Kosten für die Verwendung des Document AI-Layoutparsers werden direkt über Ihr Projekt abgerechnet.
Datentransformation (Datei aufteilung) Unterstützt die Aufteilung in Blöcke mit fester Größe, die kostenlos ist.
Generierung von Einbettungen

Die RAG Engine orchestriert die Generierung von Einbettungen mit dem von Ihnen angegebenen Einbettungsmodell. Die Kosten für dieses Modell werden Ihrem Projekt in Rechnung gestellt.

Weitere Informationen zu den Preisen finden Sie unter Kosten für das Erstellen und Bereitstellen von KI-Modellen auf der Gemini Enterprise Agent Platform.

Datenindexierung und -abruf

Die RAG Engine unterstützt zwei Kategorien von Vektordatenbanken für die Vektor Suche:

  • Von RAG verwaltete Datenbank
  • Eigene Vektordatenbank verwenden

Eine von RAG verwaltete Datenbank hat zwei Zwecke:

  • In einer von RAG verwalteten Datenbank werden RAG-Ressourcen wie RAG-Korpora und RAG-Dateien gespeichert. Dateiinhalte sind ausgeschlossen.
  • Je nach Ihrer Wahl: Indexierung und Abruf von Einbettungen für die Vektorsuche.

Eine von RAG verwaltete Datenbank verwendet eine Cloud Spanner-Instanz als Backend.

Für jedes Ihrer Projekte stellt die RAG Engine ein kundenspezifisches Google Cloud Projekt bereit und verwaltet von RAG verwaltete Ressourcen, die in der RAG Engine gespeichert sind, damit Ihre Daten physisch isoliert sind.

Wenn Sie die Dienststufe „Basic“ oder „Scaled“ von RagManagedDB auswählen, stellt die RAG Engine eine Cloud Spanner Enterprise-Instanz im entsprechenden Projekt bereit:

  • Basic: 100 Verarbeitungseinheiten mit Sicherung
  • Skaliert: Ab 1 Knoten (1.000 Verarbeitungseinheiten) mit automatischer Skalierung auf bis zu 10 Knoten mit Sicherung

Wenn ein RAG-Korpus in Ihrem Projekt eine von RAG verwaltete Datenbank für die Vektorsuche verwendet, wird Ihnen die von RAG verwaltete Cloud Spanner-Instanz in Rechnung gestellt.

Die RAG Engine überträgt die Cloud Spanner Kosten aus dem entsprechenden von RAG verwalteten Projekt in Ihr Google Cloud Projekt, sodass Sie die Kosten für die Cloud Spanner-Instanz sehen und bezahlen können.

Weitere Informationen zu den Preisen für Cloud Spanner finden Sie unter Cloud Spanner-Preise.

Reranking für die RAG Engine auf der Gemini Enterprise Agent Platform

Die folgenden Ranking-Tools werden nach dem Abruf unterstützt:

  • LLM-Reranker: Die RAG Engine verwendet das von Ihnen angegebene LLM-Modell, um die Abrufergebnisse neu zu ordnen. Die Kosten für das LLM-Modell werden direkt über Ihr Projekt abgerechnet.
  • Agent Search Ranking API: Die RAG Engine verwendet die Agent Search Ranking API, um die Abrufergebnisse neu zu ordnen. Die Kosten für die Ranking API werden direkt über Ihr Projekt abgerechnet.

RAG Engine löschen

Die folgenden Codebeispiele zeigen, wie Sie eine RAG Engine für die Google Cloud Konsole, Python und REST löschen:

Nächste Schritte