Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Opzioni del database vettoriale in RAG Engine

Questa pagina presenta i database vettoriali supportati su RAG Engine. Puoi anche scoprire come collegare un database vettoriale (archivio vettoriale) al tuo corpus RAG.

I database vettoriali svolgono un ruolo fondamentale nell'abilitazione del recupero per le applicazioni RAG. I database vettoriali offrono un modo specializzato per archiviare ed eseguire query su vector embedding, che sono rappresentazioni matematiche di testo o altri dati che acquisiscono il significato semantico e le relazioni. I vector embedding consentono ai sistemi RAG di trovare in modo rapido e accurato le informazioni più pertinenti all'interno di una vasta knowledge base, anche quando si tratta di query complesse o sfumate. Se combinati con un modello di embedding, i database vettoriali possono contribuire a superare i limiti degli LLM e fornire risposte più accurate, pertinenti e complete.

Database vettoriali supportati

Quando crei un corpus RAG, RAG Engine offre RagManagedDb pronto per l'uso aziendale come database vettoriale predefinito, che non richiede provisioning o gestione aggiuntivi. RagManagedDb offre opzioni di ricerca KNN e ANN e consente di passare a un livello di base per alcuni prototipi e sperimentazioni rapidi. Per saperne di più sulla scelta di una strategia di recupero su RagManagedDb o per aggiornare il livello, consulta Utilizzare RagManagedDb con RAG. Per consentire a RAG Engine di creare e gestire automaticamente il database vettoriale, consulta Risorsa REST: projects.locations.ragCorpora .

Oltre a RagManagedDb predefinito, RAG Engine ti consente di eseguire il provisioning e utilizzare il tuo database vettoriale all'interno del corpus RAG. In questo caso, sei responsabile del ciclo di vita e della scalabilità del tuo database vettoriale.

Confrontare le opzioni del database vettoriale

Questa tabella elenca le scelte di database vettoriali supportati in RAG Engine e fornisce link alle pagine che spiegano come utilizzare i database vettoriali all'interno del corpus RAG.

Database vettoriale	Vantaggi	Ideale per	Svantaggi	Metriche di distanza supportate	Tipo di ricerca	Fase di lancio
`RagManagedDb` (impostazione predefinita) è un servizio di database scalabile distribuito a livello regionale che offre una coerenza molto elevata e un'alta affidabilità e può essere utilizzato per una ricerca vettoriale. easy simple fast quick	Non è richiesta alcuna configurazione. Ideale per casi d'uso su scala aziendale e su piccola scala. Coerenza molto elevata. Alta affidabilità. Bassa latenza. Ottimo per i carichi di lavoro transazionali. CMEK abilitata.	Generazione di documenti di grandi dimensioni. Creazione di RAG su scala aziendale. Sviluppo di una rapida prova di fattibilità. Fornitura di un basso overhead di provisioning e manutenzione. Utilizzo con i chatbot. Creazione di applicazioni RAG.	Per un richiamo ottimale, la funzionalità ANN richiede la ricostruzione dell'indice dopo modifiche importanti ai dati.	`cosine`	KNN (impostazione predefinita) e ANN	Disponibilità generale
Vector Search è il servizio di database vettoriale all'interno di Agent Platform ottimizzato per le attività di machine learning.	Si integra con altri Google Cloud servizi. La scalabilità e l'affidabilità sono supportate dall' Google Cloud infrastruttura. Utilizza i prezzi con pagamento a consumo.	Generazione di documenti di grandi dimensioni. Creazione di RAG su scala aziendale. Gestione dell'infrastruttura del database vettoriale. Clienti esistenti Google Cloud o chiunque voglia utilizzare più Google Cloud servizi.	Gli aggiornamenti non vengono applicati immediatamente. Dipendenza dai fornitori con Google Cloud. Potrebbe essere più costoso a seconda dei casi d'uso.	`cosine` `dot-product`	ANN	Disponibilità generale
Vertex AI Feature Store è un servizio gestito per l'organizzazione, l'archiviazione e la gestione di caratteristiche di machine learning.	Si integra con Gemini Enterprise Agent Platform e altri Google Cloud servizi. La scalabilità e l'affidabilità sono supportate dall' Google Cloud infrastruttura. Sfrutta l'infrastruttura BigQuery esistente.	Generazione di documenti di grandi dimensioni. Creazione di RAG su scala aziendale. Gestione dell'infrastruttura del database vettoriale. Clienti esistenti Google Cloud o clienti che vogliono utilizzare più Google Cloud servizi.	Le modifiche sono disponibili nel negozio online solo dopo aver eseguito una sincronizzazione manuale. Dipendenza dai fornitori con Google Cloud.	`cosine` `dot-product` `L2 squared`	ANN	Anteprima
Weaviate è un database vettoriale open source flessibile e modulare.	Supporta vari tipi di dati e offre funzionalità di grafici integrate. Fornisce open source e una community vivace. Altamente flessibile e personalizzabile. Supporta diversi tipi di dati e moduli per diverse modalità, come testo e immagini. Puoi scegliere tra i fornitori di servizi cloud, ad esempio Google CloudAWS e Azure.	Generazione di documenti di grandi dimensioni. Creazione di RAG su scala aziendale. Gestione dell'infrastruttura del database vettoriale. Clienti Weaviate esistenti.	Gli aggiornamenti non vengono applicati immediatamente. La configurazione e la gestione possono essere più complesse. Le prestazioni possono variare a seconda della configurazione.	`cosine` `dot-product` `L2 squared` `hamming` `manhattan`	Supporto per la ricerca ibrida + ANN	Anteprima
Pinecone è un database vettoriale cloud-native completamente gestito progettato per una ricerca di somiglianza ad alte prestazioni.	Inizia subito. Scalabilità e prestazioni eccellenti. Concentrati sulla ricerca vettoriale con funzionalità avanzate come il filtraggio e la ricerca di metadati. Puoi scegliere tra i fornitori di servizi cloud, ad esempio Google CloudAWS e Azure.	Generazione di documenti di grandi dimensioni. Creazione di RAG su scala aziendale. Gestione dell'infrastruttura del database vettoriale. Clienti Pinecone esistenti.	Gli aggiornamenti non vengono applicati immediatamente. Può essere più costoso rispetto ad altre opzioni. Quote e limiti limitano la scalabilità e le prestazioni. Controllo limitato sull'infrastruttura sottostante.	`cosine` `euclidean` `dot-product`	ANN	Disponibilità generale

Passaggi successivi

Per creare un corpus RAG, consulta Metodo: ragCorpora.create
Per elencare il corpus RAG, consulta Metodo: ragCorpora.list