Auswahlmöglichkeiten für Vektordatenbanken in RAG Engine

Auf dieser Seite werden die Vektordatenbanken vorgestellt, die von der RAG Engine unterstützt werden. Außerdem erfahren Sie, wie Sie eine Vektordatenbank (Vektorspeicher) mit Ihrem RAG-Korpus verbinden.

Vektordatenbanken spielen eine entscheidende Rolle für den Abruf von Informationen für RAG-Anwendungen. Vektordatenbanken bieten eine spezielle Möglichkeit zum Speichern und Abfragen von Vektoreinbettungen. Das sind mathematische Darstellungen von Text oder anderen Daten, die semantische Bedeutung und Beziehungen erfassen. Mit Vektoreinbettungen können RAG-Systeme schnell und genau die relevantesten Informationen in einer riesigen Wissensdatenbank finden, auch bei komplexen oder differenzierten Abfragen. In Kombination mit einem Einbettungsmodell können Vektordatenbanken dazu beitragen, die Einschränkungen von LLMs zu überwinden und genauere, relevantere und umfassendere Antworten zu liefern.

Unterstützte Vektordatenbanken

Beim Erstellen eines RAG-Korpus bietet die RAG Engine die unternehmenstaugliche RagManagedDb als Standard-Vektordatenbank an, für die keine zusätzliche Bereitstellung oder Verwaltung erforderlich ist. RagManagedDb bietet sowohl KNN- als auch ANN-Suchoptionen und ermöglicht den Wechsel zu einer Basic-Stufe für schnelles Prototyping und Experimentieren. Weitere Informationen zur Auswahl einer Abrufstrategie für RagManagedDb oder zum Aktualisieren der Stufe finden Sie unter Verwenden Sie RagManagedDb mit RAG. Wenn die RAG Engine die Vektordatenbank automatisch für Sie erstellen und verwalten soll, lesen Sie den Hilfeartikel REST-Ressource:projects.locations.ragCorpora .

Zusätzlich zur Standard-RagManagedDb können Sie mit der RAG Engine Ihre Vektordatenbank in Ihrem RAG-Korpus bereitstellen und verwenden. In diesem Fall sind Sie für den Lebenszyklus und die Skalierbarkeit Ihrer Vektordatenbank verantwortlich.

Optionen für Vektordatenbanken vergleichen

In dieser Tabelle sind die Vektordatenbanken aufgeführt, die in der RAG Engine unterstützt werden. Außerdem finden Sie Links zu Seiten, auf denen erklärt wird, wie Sie sie in Ihrem RAG-Korpus verwenden.

Vektordatenbank Vorteile Am besten geeignet für Nachteile Unterstützte Distanzmesswerte Suchtyp Startphase
RagManagedDb (Standard) ist ein regional verteilter, skalierbarer Datenbankdienst, der sehr hohe Konsistenz und Hochverfügbarkeit bietet und für eine Vektorsuche verwendet werden kann. einfach schnell
  • Keine Einrichtung erforderlich.
  • Gut für Anwendungsfälle im Unternehmen und im kleinen Maßstab.
  • Sehr hohe Konsistenz.
  • Hochverfügbarkeit.
  • Niedrige Latenz.
  • Hervorragend für transaktionale Arbeitslasten.
  • CMEK aktiviert.
  • Generieren großer Mengen von Dokumenten.
  • Erstellen von RAG im Unternehmen.
  • Schnelles Erstellen eines Proof of Concept.
  • Geringer Bereitstellungs- und Wartungsaufwand.
  • Verwendung mit Chatbots.
  • Erstellen von RAG-Anwendungen.
  • Für einen optimalen Recall muss der Index nach größeren Änderungen an Ihren Daten mit der ANN-Funktion neu erstellt werden.
cosine KNN (Standard) und ANN Allgemein verfügbar
Die Vektorsuche ist der Vektordatenbankdienst in der Agent Platform, der für Aufgaben im Bereich des maschinellen Lernens optimiert ist.
  • Lässt sich in andere Google Cloud Dienste einbinden.
  • Skalierbarkeit und Zuverlässigkeit werden von der Google Cloud Infrastruktur unterstützt.
  • Nutzungsbasierte Preisgestaltung („Pay as you go“).
  • Generieren großer Mengen von Dokumenten.
  • Erstellen von RAG im Unternehmen.
  • Verwalten der Vektordatenbankinfrastruktur.
  • Bestandskunden oder alle, die mehrere Dienste verwenden möchten. Google Cloud Google Cloud
  • Aktualisierungen werden nicht sofort übernommen.
  • Anbieterabhängigkeit mit Google Cloud.
  • Je nach Anwendungsfall möglicherweise teurer.
cosine

dot-product
ANN Allgemein verfügbar
Vertex AI Feature Store ist ein verwalteter Dienst zum Organisieren, Speichern und Bereitstellen von Features für maschinelles Lernen.
  • Lässt sich in die Gemini Enterprise Agent Platform und andere Google Cloud Dienste einbinden.
  • Skalierbarkeit und Zuverlässigkeit werden von der Google Cloud Infrastruktur unterstützt.
  • Nutzt die vorhandene BigQuery-Infrastruktur.
  • Generieren großer Mengen von Dokumenten.
  • Erstellen von RAG im Unternehmen.
  • Verwalten der Vektordatenbankinfrastruktur.
  • Bestandskunden Google Cloud oder Kunden, die mehrere Google Cloud Dienste verwenden möchten.
  • Änderungen sind erst im Onlineshop verfügbar, nachdem eine manuelle Synchronisierung durchgeführt wurde.
  • Anbieterabhängigkeit mit Google Cloud.
cosine

dot-product

L2 squared
ANN Vorschau
Weaviate ist eine flexible und modulare Open-Source-Vektordatenbank.
  • Unterstützt verschiedene Datentypen und bietet integrierte Diagrammfunktionen.
  • Open Source und eine aktive Community.
  • Sehr flexibel und anpassbar.
  • Unterstützt verschiedene Datentypen und Module für unterschiedliche Modalitäten wie Text und Bilder.
  • Sie können zwischen Cloud-Anbietern wie Google CloudAWS und Azure wählen.
  • Generieren großer Mengen von Dokumenten.
  • Erstellen von RAG im Unternehmen.
  • Verwalten der Vektordatenbankinfrastruktur.
  • Bestandskunden von Weaviate.
  • Aktualisierungen werden nicht sofort übernommen.
  • Einrichtung und Verwaltung können komplexer sein.
  • Die Leistung kann je nach Konfiguration variieren.
cosine

dot-product

L2 squared

hamming

manhattan
ANN + Unterstützung für Hybridsuche Vorschau
Pinecone ist eine vollständig verwaltete, cloudnative Vektordatenbank, die für eine leistungsstarke Ähnlichkeitssuche entwickelt wurde.
  • Schneller Einstieg.
  • Hervorragende Skalierbarkeit und Leistung.
  • Fokus auf die Vektorsuche mit erweiterten Funktionen wie Filterung und Metadatensuche.
  • Sie können zwischen Cloud-Anbietern wie Google CloudAWS und Azure wählen.
  • Generieren großer Mengen von Dokumenten.
  • Erstellen von RAG im Unternehmen.
  • Verwalten der Vektordatenbankinfrastruktur.
  • Bestandskunden von Pinecone.
  • Aktualisierungen werden nicht sofort übernommen.
  • Kann teurer als andere Optionen sein.
  • Kontingente und Limits schränken Skalierung und Leistung ein.
  • Begrenzte Kontrolle über die zugrunde liegende Infrastruktur.
cosine

euclidean

dot-product
ANN Allgemein verfügbar

Nächste Schritte