Gemini Enterprise Agent Platform – Übersicht über die RAG Engine

Auf dieser Seite wird beschrieben, was die RAG-Engine der Gemini Enterprise Agent Platform ist und wie sie funktioniert.

Beschreibung Console
Informationen zur Verwendung des Vertex AI SDK zum Ausführen von RAG-Engine-Aufgaben der Gemini Enterprise Agent Platform finden Sie in der RAG-Kurzanleitung für Python. RAG Engine der Gemini Enterprise Agent Platform testen

Übersicht

Die RAG-Engine der Gemini Enterprise Agent Platform, eine Komponente der Gemini Enterprise Agent Platform, ermöglicht Retrieval-Augmented Generation (RAG). Die RAG Engine der Gemini Enterprise Agent Platform ist ebenfalls ein Datenframework für die Entwicklung von Anwendungen, die kontexterweiterte Large Language Models (LLMs) nutzen. Die Kontexterweiterung erfolgt, wenn Sie ein LLM auf Ihre Daten anwenden. Hier wird Retrieval Augmented Generation (RAG) implementiert.

Ein häufiges Problem bei LLMs ist, dass sie kein privates Wissen, also die Daten Ihrer Organisation, verstehen. Mit der Gemini Enterprise Agent Platform RAG Engine können Sie den LLM-Kontext mit zusätzlichen privaten Informationen anreichern, damit das Modell Halluzinationen reduzieren und Fragen genauer beantworten kann.

Durch die Kombination zusätzlicher Wissensquellen mit dem vorhandenen Wissen von LLMs wird ein besserer Kontext bereitgestellt. Der verbesserte Kontext zusammen mit der Abfrage verbessert die Qualität der LLM-Antwort.

Das folgende Bild veranschaulicht die wichtigsten Konzepte zum Verständnis der RAG-Engine der Gemini Enterprise Agent Platform.

Wichtige Konzepte für Agent Platform-RAG

Diese Konzepte sind in der Reihenfolge des RAG-Prozesses (Retrieval-Augmented Generation) aufgeführt.

  1. Datenaufnahme: Nehmen Sie Daten aus verschiedenen Datenquellen auf. Zum Beispiel lokale Dateien, Cloud Storage und Google Drive.

  2. Datentransformation: Konvertierung der Daten in der Vorbereitung auf die Indexierung. Beispielsweise werden Daten in Blöcke unterteilt.

  3. Einbettung: Numerische Darstellungen von Wörtern oder Textabschnitten. Diese Zahlen erfassen die semantische Bedeutung und den Kontext des Texts. Ähnliche oder verwandte Wörter oder Text haben in der Regel ähnliche Einbettungen. Das bedeutet, dass sie im hochdimensionalen Vektorbereich näher beieinander liegen.

  4. Datenindexierung: Die RAG Engine der Gemini Enterprise Agent Platform erstellt einen Index, der als Korpus bezeichnet wird. Der Index strukturiert die Wissensdatenbank so, dass sie für die Suche optimiert ist. Der Index ist beispielsweise mit einem detaillierten Inhaltsverzeichnis für ein großes Referenzbuch vergleichbar.

  5. Abrufen: Wenn ein Nutzer eine Frage stellt oder einen Prompt bereitstellt, durchsucht die Abrufkomponente in der RAG-Engine der Gemini Enterprise Agent Platform in ihrer Wissensdatenbank nach relevanten Informationen.

  6. Generierung: Die abgerufenen Informationen werden zum Kontext, der der ursprünglichen Nutzeranfrage als Leitfaden für das generative KI-Modell hinzugefügt wurde, um faktisch fundierte und relevante Antworten zu generieren.

Unterstützte Regionen

Die RAG Engine der Gemini Enterprise Agent Platform wird in den folgenden Regionen unterstützt:

Region Standort Beschreibung Startphase
us-central1 Iowa Die Versionen v1 und v1beta1 werden unterstützt. Zulassungsliste, GA
us-east4 Virginia Die Versionen v1 und v1beta1 werden unterstützt. Zulassungsliste, GA
us-east1 Moncks Corner, SC Die Versionen v1 und v1beta1 werden unterstützt. Zulassungsliste, Vorschau
europe-west3 Frankfurt, Deutschland Die Versionen v1 und v1beta1 werden unterstützt. GA
europe-west4 Eemshaven, Niederlande Die Versionen v1 und v1beta1 werden unterstützt. GA
asia-east1 Taiwan Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
asia-northeast1 Tokio Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
asia-northeast3 Seoul Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
asia-south1 Mumbai Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
asia-southeast1 Singapur Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-central2 Warschau Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-north1 Finnland Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-southwest1 Madrid Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-west1 Belgien Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-west2 London Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-west6 Zürich Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-west8 Mailand Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
europe-west9 Paris Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
us-east5 Columbus, OH Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
us-south1 Dallas, TX Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
us-west1 Oregon Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
us-west4 Las Vegas, NV Die Versionen v1 und v1beta1 werden unterstützt. Vorschau
  • us-central1, us-east1 und us-east4 werden in Allowlist geändert. Wenn Sie die RAG Engine der Gemini Enterprise Agent Platform testen möchten, versuchen Sie es mit anderen Regionen.

RAG Engine der Gemini Enterprise Agent Platform löschen

Weitere Informationen zum Löschen einer RAG Engine der Gemini Enterprise Agent Platform finden Sie unter:

Nächste Schritte