Panoramica del motore RAG di Vertex AI

Questa pagina descrive cos'è Vertex AI RAG Engine e come funziona.

Descrizione Console
Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività di Vertex AI RAG Engine, consulta la guida rapida RAG per Python.

Prova Vertex AI RAG Engine

Panoramica

Vertex AI RAG Engine, un componente della piattaforma Vertex AI, facilita la generazione RAG (Retrieval-Augmented Generation). Vertex AI RAG Engine è anche un framework di dati per lo sviluppo di applicazioni basate su modelli linguistici di grandi dimensioni (LLM) con aggiunta del contesto. L'aggiunta del contesto si verifica quando un modello LLM viene applicato ai dati. È così che viene implementata la generazione RAG (Retrieval-Augmented Generation).

Un problema comune con i LLM è che non comprendono le conoscenze private, ovvero i dati della tua organizzazione. Con Vertex AI RAG Engine, puoi arricchire il contesto del modello LLM con informazioni private aggiuntive, perché il modello può ridurre le allucinazioni e rispondere alle domande in modo più preciso.

Combinando fonti di conoscenza aggiuntive con le conoscenze esistenti degli LLM, viene fornito un contesto migliore. Il contesto migliorato insieme alla query migliora la qualità della risposta dell'LLM.

La seguente immagine illustra i concetti chiave per comprendere Vertex AI RAG Engine.

Concetti chiave di Vertex AI RAG

Questi concetti sono elencati nell'ordine del processo di generazione RAG (Retrieval-Augmented Generation).

  1. Importazione dei dati: importazione dei dati da diverse origini dati. Ad esempio, file locali, Cloud Storage e Google Drive.

  2. Trasformazione dei dati: Conversione dei dati in preparazione dell'indicizzazione. Ad esempio, i dati vengono divisi in blocchi.

  3. Incorporamento: rappresentazioni numeriche di parole o parti di testo. Questi numeri acquisiscono il significato semantico e il contesto del testo. Parole o testi simili o correlati tendono ad avere incorporamenti simili, il che significa che sono più vicini nello spazio vettoriale di grandi dimensioni.

  4. Indicizzazione dei dati: Vertex AI RAG Engine crea un indice chiamato corpus. L'indice struttura la knowledge base in modo che sia ottimizzata per la ricerca. Ad esempio, l'indice è come un indice dettagliato per un enorme libro di consultazione.

  5. Recupero: quando un utente pone una domanda o fornisce un prompt, il componente di recupero di Vertex AI RAG Engine esegue ricerche nella sua knowledge base per trovare informazioni pertinenti alla query.

  6. Generazione: le informazioni recuperate diventano il contesto aggiunto alla query utente originale come guida per il modello di AI generativa per generare risposte basate sui fatti e pertinenti.

Aree geografiche supportate

Vertex AI RAG Engine è supportato nelle seguenti regioni:

Regione Località Descrizione Fase di lancio
us-central1 Iowa Sono supportate le versioni v1 e v1beta1. Lista consentita
us-east4 Virginia Sono supportate le versioni v1 e v1beta1. Lista consentita
europe-west3 Francoforte, Germania Sono supportate le versioni v1 e v1beta1. GA
europe-west4 Eemshaven, Paesi Bassi Sono supportate le versioni v1 e v1beta1. GA
asia-east1 Taiwan Sono supportate le versioni v1 e v1beta1. Anteprima
asia-northeast1 Tokyo Sono supportate le versioni v1 e v1beta1. Anteprima
asia-northeast3 Seul Sono supportate le versioni v1 e v1beta1. Anteprima
asia-south1 Mumbai Sono supportate le versioni v1 e v1beta1. Anteprima
asia-southeast1 Singapore Sono supportate le versioni v1 e v1beta1. Anteprima
europe-central2 Varsavia Sono supportate le versioni v1 e v1beta1. Anteprima
europe-north1 Finlandia Sono supportate le versioni v1 e v1beta1. Anteprima
europe-southwest1 Madrid Sono supportate le versioni v1 e v1beta1. Anteprima
europe-west1 Belgio Sono supportate le versioni v1 e v1beta1. Anteprima
europe-west2 Londra Sono supportate le versioni v1 e v1beta1. Anteprima
europe-west6 Zurigo Sono supportate le versioni v1 e v1beta1. Anteprima
europe-west8 Milano Sono supportate le versioni v1 e v1beta1. Anteprima
europe-west9 Parigi Sono supportate le versioni v1 e v1beta1. Anteprima
us-east1 Moncks Corner, SC Sono supportate le versioni v1 e v1beta1. Anteprima
us-east5 Columbus, OH Sono supportate le versioni v1 e v1beta1. Anteprima
us-south1 Dallas, TX Sono supportate le versioni v1 e v1beta1. Anteprima
us-west1 Oregon Sono supportate le versioni v1 e v1beta1. Anteprima
us-west4 Las Vegas, NV Sono supportate le versioni v1 e v1beta1. Anteprima
  • us-central1 e us-east4 sono stati modificati in Allowlist. Se vuoi sperimentare con Vertex AI RAG Engine, prova altre regioni. Se prevedi di eseguire l'onboarding del traffico di produzione in queste regioni, contatta vertex-ai-rag-engine-support@google.com.

Elimina Vertex AI RAG Engine

I seguenti esempi di codice mostrano come eliminare un motore Vertex AI RAG per la console Google Cloud , Python e REST:

Invia feedback

Per chattare con l'assistenza Google, vai al gruppo di assistenza motore RAG di Vertex AI.

Per inviare un'email, utilizza l'indirizzo email vertex-ai-rag-engine-support@google.com.

Passaggi successivi