Questa pagina presenta i database vettoriali supportati su RAG Engine di Agent Platform di Gemini Enterprise. Puoi anche scoprire come collegare un database vettoriale (archivio vettoriale) al tuo corpus RAG.
I database vettoriali svolgono un ruolo fondamentale nell'abilitazione del recupero per le applicazioni RAG. I database vettoriali offrono un modo specializzato per archiviare ed eseguire query su vector embedding, che sono rappresentazioni matematiche di testo o altri dati che acquisiscono il significato semantico e le relazioni. I vector embedding consentono ai sistemi RAG di trovare rapidamente e con precisione le informazioni più pertinenti all'interno di una vasta knowledge base, anche quando si tratta di query complesse o sfumate. Se combinati con un modello di embedding, i database vettoriali possono contribuire a superare i limiti degli LLM e fornire risposte più accurate, pertinenti e complete.
Database vettoriali supportati
Quando crei un corpus RAG, RAG Engine di Agent Platform di Gemini Enterprise offre RagManagedDb di livello enterprise come database vettoriale predefinito, che non richiede provisioning o gestione aggiuntivi. RagManagedDb offre opzioni di ricerca KNN e ANN e consente di passare a un livello base per alcuni prototipi e sperimentazioni rapidi. Per saperne di più sulla scelta di una strategia di recupero su
RagManagedDb o per aggiornare il livello, consulta Utilizzare RagManagedDb con
RAG. Per consentire a RAG Engine di Agent Platform di Gemini Enterprise di
creare e gestire automaticamente il database vettoriale, consulta Risorsa REST:
projects.locations.ragCorpora
.
Oltre a RagManagedDb predefinito, RAG Engine di Agent Platform di Gemini Enterprise ti consente di eseguire il provisioning e utilizzare il database vettoriale all'interno del corpus RAG. In questo caso, sei responsabile del ciclo di vita e della scalabilità del database vettoriale.
Confrontare le opzioni del database vettoriale
Questa tabella elenca le scelte di database vettoriali supportati in RAG Engine di Agent Platform di Gemini Enterprise e fornisce link alle pagine che spiegano come utilizzare i database vettoriali all'interno del corpus RAG.
| Database vettoriale | Vantaggi | Ideale per | Svantaggi | Metriche di distanza supportate | Tipo di ricerca | Fase di lancio |
|---|---|---|---|---|---|---|
RagManagedDb (impostazione predefinita) è un servizio di database scalabile distribuito a livello regionale che offre una coerenza molto elevata e un'alta affidabilità e può essere utilizzato per una ricerca vettoriale.
facile semplice veloce rapido |
|
|
|
cosine |
KNN (impostazione predefinita) e ANN | Disponibilità generale |
| Vector Search è il servizio di database vettoriale all'interno di Agent Platform ottimizzato per le attività di machine learning. |
|
|
|
cosinedot-product |
ANN | Disponibilità generale |
| Vertex AI Feature Store è un servizio gestito per l'organizzazione, l'archiviazione e la gestione di caratteristiche di machine learning. |
|
|
|
cosinedot-productL2 squared |
ANN | Anteprima |
| Weaviate è un database vettoriale open source flessibile e modulare. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
Supporto per la ricerca ibrida + ANN | Anteprima |
| Pinecone è un database vettoriale cloud-native completamente gestito progettato per una ricerca di somiglianza ad alte prestazioni. |
|
|
|
cosineeuclideandot-product |
ANN | Disponibilità generale |
Passaggi successivi
Per creare un corpus RAG, consulta Metodo: ragCorpora.create
Per elencare il corpus RAG, consulta Metodo: ragCorpora.list