Scelte del database vettoriale in RAG Engine della piattaforma agentica Gemini Enterprise

Questa pagina presenta i database vettoriali supportati su RAG Engine di Agent Platform di Gemini Enterprise. Puoi anche scoprire come collegare un database vettoriale (archivio vettoriale) al tuo corpus RAG.

I database vettoriali svolgono un ruolo fondamentale nell'abilitazione del recupero per le applicazioni RAG. I database vettoriali offrono un modo specializzato per archiviare ed eseguire query su vector embedding, che sono rappresentazioni matematiche di testo o altri dati che acquisiscono il significato semantico e le relazioni. I vector embedding consentono ai sistemi RAG di trovare rapidamente e con precisione le informazioni più pertinenti all'interno di una vasta knowledge base, anche quando si tratta di query complesse o sfumate. Se combinati con un modello di embedding, i database vettoriali possono contribuire a superare i limiti degli LLM e fornire risposte più accurate, pertinenti e complete.

Database vettoriali supportati

Quando crei un corpus RAG, RAG Engine di Agent Platform di Gemini Enterprise offre RagManagedDb di livello enterprise come database vettoriale predefinito, che non richiede provisioning o gestione aggiuntivi. RagManagedDb offre opzioni di ricerca KNN e ANN e consente di passare a un livello base per alcuni prototipi e sperimentazioni rapidi. Per saperne di più sulla scelta di una strategia di recupero su RagManagedDb o per aggiornare il livello, consulta Utilizzare RagManagedDb con RAG. Per consentire a RAG Engine di Agent Platform di Gemini Enterprise di creare e gestire automaticamente il database vettoriale, consulta Risorsa REST: projects.locations.ragCorpora .

Oltre a RagManagedDb predefinito, RAG Engine di Agent Platform di Gemini Enterprise ti consente di eseguire il provisioning e utilizzare il database vettoriale all'interno del corpus RAG. In questo caso, sei responsabile del ciclo di vita e della scalabilità del database vettoriale.

Confrontare le opzioni del database vettoriale

Questa tabella elenca le scelte di database vettoriali supportati in RAG Engine di Agent Platform di Gemini Enterprise e fornisce link alle pagine che spiegano come utilizzare i database vettoriali all'interno del corpus RAG.

Database vettoriale Vantaggi Ideale per Svantaggi Metriche di distanza supportate Tipo di ricerca Fase di lancio
RagManagedDb (impostazione predefinita) è un servizio di database scalabile distribuito a livello regionale che offre una coerenza molto elevata e un'alta affidabilità e può essere utilizzato per una ricerca vettoriale. facile semplice veloce rapido
  • Non è richiesta alcuna configurazione.
  • Ideale per casi d'uso su scala aziendale e su piccola scala.
  • Coerenza molto elevata.
  • Alta affidabilità.
  • Bassa latenza.
  • Ottimo per i carichi di lavoro transazionali.
  • CMEK abilitata.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG su scala aziendale.
  • Sviluppo di una rapida prova di fattibilità.
  • Fornitura di un basso overhead di provisioning e manutenzione.
  • Utilizzo con i chatbot.
  • Creazione di applicazioni RAG.
  • Per un richiamo ottimale, la funzionalità ANN richiede la ricostruzione dell'indice dopo modifiche importanti ai dati.
cosine KNN (impostazione predefinita) e ANN Disponibilità generale
Vector Search è il servizio di database vettoriale all'interno di Agent Platform ottimizzato per le attività di machine learning.
  • Si integra con altri Google Cloud servizi.
  • La scalabilità e l'affidabilità sono supportate dall' Google Cloud infrastruttura.
  • Utilizza i prezzi con pagamento a consumo.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG su scala aziendale.
  • Gestione dell'infrastruttura del database vettoriale.
  • Clienti esistenti Google Cloud o chiunque voglia utilizzare più Google Cloud servizi.
  • Gli aggiornamenti non vengono applicati immediatamente.
  • Vincoli al fornitore con Google Cloud.
  • Potrebbe essere più costoso a seconda dei casi d'uso.
cosine

dot-product
ANN Disponibilità generale
Vertex AI Feature Store è un servizio gestito per l'organizzazione, l'archiviazione e la gestione di caratteristiche di machine learning.
  • Si integra con Agent Platform di Gemini Enterprise e altri Google Cloud servizi.
  • La scalabilità e l'affidabilità sono supportate dall' Google Cloud infrastruttura.
  • Sfrutta l'infrastruttura BigQuery esistente.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG su scala aziendale.
  • Gestione dell'infrastruttura del database vettoriale.
  • Clienti esistenti Google Cloud o clienti che vogliono utilizzare più Google Cloud servizi.
  • Le modifiche sono disponibili nel negozio online solo dopo aver eseguito una sincronizzazione manuale.
  • Vincoli al fornitore con Google Cloud.
cosine

dot-product

L2 squared
ANN Anteprima
Weaviate è un database vettoriale open source flessibile e modulare.
  • Supporta vari tipi di dati e offre funzionalità di grafici integrate.
  • Fornisce open source e una community vivace.
  • Altamente flessibile e personalizzabile.
  • Supporta diversi tipi di dati e moduli per diverse modalità, come testo e immagini.
  • Puoi scegliere tra i provider di servizi cloud, ad esempio Google CloudAWS e Azure.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG su scala aziendale.
  • Gestione dell'infrastruttura del database vettoriale.
  • Clienti Weaviate esistenti.
  • Gli aggiornamenti non vengono applicati immediatamente.
  • La configurazione e la gestione possono essere più complesse.
  • Il rendimento può variare a seconda della configurazione.
cosine

dot-product

L2 squared

hamming

manhattan
Supporto per la ricerca ibrida + ANN Anteprima
Pinecone è un database vettoriale cloud-native completamente gestito progettato per una ricerca di somiglianza ad alte prestazioni.
  • Inizia velocemente.
  • Scalabilità e prestazioni eccellenti.
  • Concentrati sulla ricerca vettoriale con funzionalità avanzate come il filtro e la ricerca di metadati.
  • Puoi scegliere tra i provider di servizi cloud, ad esempio Google CloudAWS e Azure.
  • Generazione di documenti di grandi dimensioni.
  • Creazione di RAG su scala aziendale.
  • Gestione dell'infrastruttura del database vettoriale.
  • Clienti Pinecone esistenti.
  • Gli aggiornamenti non vengono applicati immediatamente.
  • Può essere più costoso rispetto ad altre opzioni.
  • Quote e limiti limitano la scalabilità e il rendimento.
  • Controllo limitato sull'infrastruttura sottostante.
cosine

euclidean

dot-product
ANN Disponibilità generale

Passaggi successivi