Auf dieser Seite werden die Vektordatenbanken vorgestellt, die von der RAG Engine unterstützt werden. Außerdem erfahren Sie, wie Sie eine Vektordatenbank (Vektorspeicher) mit Ihrem RAG-Korpus verbinden.
Vektordatenbanken spielen eine entscheidende Rolle für den Abruf von Informationen für RAG-Anwendungen. Vektordatenbanken bieten eine spezielle Möglichkeit zum Speichern und Abfragen von Vektoreinbettungen. Das sind mathematische Darstellungen von Text oder anderen Daten, die semantische Bedeutung und Beziehungen erfassen. Mit Vektoreinbettungen können RAG-Systeme schnell und genau die relevantesten Informationen in einer riesigen Wissensdatenbank finden, auch bei komplexen oder differenzierten Abfragen. In Kombination mit einem Einbettungsmodell können Vektordatenbanken dazu beitragen, die Einschränkungen von LLMs zu überwinden und genauere, relevantere und umfassendere Antworten zu liefern.
Unterstützte Vektordatenbanken
Beim Erstellen eines RAG-Korpus bietet die RAG Engine die unternehmenstaugliche RagManagedDb als Standard-Vektordatenbank an, für die keine zusätzliche Bereitstellung oder Verwaltung erforderlich ist. RagManagedDb bietet sowohl KNN- als auch ANN-Suchoptionen und ermöglicht den Wechsel zu einer Basic-Stufe für schnelles Prototyping und Experimentieren. Weitere Informationen zur Auswahl einer Abrufstrategie für
RagManagedDb oder zum Aktualisieren der Stufe finden Sie unter Verwenden Sie RagManagedDb mit
RAG. Wenn die RAG Engine die Vektordatenbank automatisch für Sie erstellen und verwalten soll, lesen Sie den Hilfeartikel REST-Ressource:projects.locations.ragCorpora
.
Zusätzlich zur Standard-RagManagedDb können Sie mit der RAG Engine Ihre Vektordatenbank in Ihrem RAG-Korpus bereitstellen und verwenden. In diesem Fall sind Sie für den Lebenszyklus und die Skalierbarkeit Ihrer Vektordatenbank verantwortlich.
Optionen für Vektordatenbanken vergleichen
In dieser Tabelle sind die Vektordatenbanken aufgeführt, die in der RAG Engine unterstützt werden. Außerdem finden Sie Links zu Seiten, auf denen erklärt wird, wie Sie sie in Ihrem RAG-Korpus verwenden.
| Vektordatenbank | Vorteile | Am besten geeignet für | Nachteile | Unterstützte Distanzmesswerte | Suchtyp | Startphase |
|---|---|---|---|---|---|---|
RagManagedDb (Standard) ist ein regional verteilter, skalierbarer Datenbankdienst, der sehr hohe Konsistenz und Hochverfügbarkeit bietet und für eine Vektorsuche verwendet werden kann.
einfach schnell |
|
|
|
cosine |
KNN (Standard) und ANN | Allgemein verfügbar |
| Die Vektorsuche ist der Vektordatenbankdienst in der Agent Platform, der für Aufgaben im Bereich des maschinellen Lernens optimiert ist. |
|
|
|
cosinedot-product |
ANN | Allgemein verfügbar |
| Vertex AI Feature Store ist ein verwalteter Dienst zum Organisieren, Speichern und Bereitstellen von Features für maschinelles Lernen. |
|
|
|
cosinedot-productL2 squared |
ANN | Vorschau |
| Weaviate ist eine flexible und modulare Open-Source-Vektordatenbank. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
ANN + Unterstützung für Hybridsuche | Vorschau |
| Pinecone ist eine vollständig verwaltete, cloudnative Vektordatenbank, die für eine leistungsstarke Ähnlichkeitssuche entwickelt wurde. |
|
|
|
cosineeuclideandot-product |
ANN | Allgemein verfügbar |
Nächste Schritte
Informationen zum Erstellen eines RAG-Korpus finden Sie unter Methode: ragCorpora.create.
Informationen zum Auflisten von RAG-Korpora finden Sie unter Methode: ragCorpora.list.