Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Panoramica di RAG Engine su Gemini Enterprise Agent Platform

Questa pagina descrive cos'è RAG Engine e come funziona.

Descrizione	Console
Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività di RAG Engine su Gemini Enterprise Agent Platform, consulta la guida rapida di RAG per Python.	Prova RAG Engine

Panoramica

RAG Engine, un componente di Gemini Enterprise Agent Platform, facilita la generazione Retrieval-Augmented Generation (RAG). RAG Engine è anche un framework di dati per lo sviluppo di applicazioni basate su modelli linguistici di grandi dimensioni (LLM) con aggiunta del contesto. Questa si verifica quando un modello LLM viene applicato ai dati. È così che viene implementata la generazione Retrieval-Augmented Generation (RAG).

Un problema comune con i modelli LLM è che non comprendono la conoscenza privata, ovvero i dati della tua organizzazione. Con RAG Engine, puoi arricchire il contesto dei modelli LLM con informazioni private aggiuntive, in modo che il modello possa ridurre le allucinazioni e rispondere alle domande in modo più preciso.

Combinando ulteriori fonti di conoscenza con la conoscenza esistente dei modelli LLM, viene fornito un contesto migliore. Il contesto migliorato insieme alla query migliora la qualità della risposta del modello LLM.

L'immagine seguente illustra i concetti chiave per comprendere RAG Engine.

Concetti chiave di RAG
di Agent Platform

Questi concetti sono elencati nell'ordine della procedura di generazione Retrieval-Augmented Generation (RAG).

Importazione dei dati: importa i dati da diverse origini dati. Ad esempio, file locali, Cloud Storage e Google Drive.
Trasformazione dei dati: conversione dei dati in preparazione per l'indicizzazione. Ad esempio, i dati vengono suddivisi in blocchi.
Incorporamento: rappresentazioni numeriche di parole o parti di testo. Questi numeri acquisiscono il significato semantico e il contesto del testo. Le parole o il testo simili o correlati tendono ad avere incorporamenti simili, il che significa che sono più vicini nello spazio vettoriale ad alta dimensionalità.
Indicizzazione dei dati: RAG Engine crea un indice chiamato corpus. L'indice struttura la knowledge base in modo che sia ottimizzata per la ricerca. Ad esempio, l'indice è come un sommario dettagliato di un libro di riferimento di grandi dimensioni.
Recupero: quando un utente pone una domanda o fornisce un prompt, il componente di recupero in RAG Engine esegue una ricerca nella knowledge base per trovare informazioni pertinenti alla query.
Generazione: le informazioni recuperate diventano il contesto aggiunto alla query utente originale come guida per il modello di AI generativa per generare risposte basate sui fatti e pertinenti.

Aree geografiche supportate

RAG Engine è supportato nelle seguenti regioni:

Regione	Località	Descrizione	Fase di lancio
`us-central1`	Iowa	Sono supportate le versioni `v1` e `v1beta1`.	Lista consentita, GA
`us-east4`	Virginia	Sono supportate le versioni `v1` e `v1beta1`.	Lista consentita, GA
`us-east1`	Moncks Corner, SC	Sono supportate le versioni `v1` e `v1beta1`.	Lista consentita, anteprima
`europe-west3`	Francoforte, Germania	Sono supportate le versioni `v1` e `v1beta1`.	GA
`europe-west4`	Eemshaven, Paesi Bassi	Sono supportate le versioni `v1` e `v1beta1`.	GA
`asia-east1`	Taiwan	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`asia-northeast1`	Tokyo	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`asia-northeast3`	Seul	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`asia-south1`	Mumbai	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`asia-southeast1`	Singapore	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-central2`	Varsavia	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-north1`	Finlandia	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-southwest1`	Madrid	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-west1`	Belgio	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-west2`	Londra	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-west6`	Zurigo	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-west8`	Milano	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`europe-west9`	Parigi	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`us-east5`	Columbus, OH	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`us-south1`	Dallas, TX	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`us-west1`	Oregon	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima
`us-west4`	Las Vegas, NV	Sono supportate le versioni `v1` e `v1beta1`.	Anteprima

us-central1, us-east1 e us-east4 sono state modificate in Allowlist. Se vuoi sperimentare con RAG Engine, prova altre regioni.

Elimina RAG Engine

Per saperne di più sull'eliminazione di un motore RAG, consulta le seguenti sezioni:

Parametri dell'API versione 1 (v1)
Parametri dell'API v1beta1

Passaggi successivi

Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività di RAG Engine su Gemini Enterprise Agent Platform, consulta la guida rapida di RAG per Python.
Per scoprire di più sul grounding, consulta la Grounding overview.
Per saperne di più sulle risposte di RAG, consulta GenerateContentResponse.