Questa pagina descrive cos'è Gemini Enterprise Agent Platform RAG Engine e come funziona.
| Descrizione | Console |
|---|---|
| Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività del motore RAG di Gemini Enterprise Agent Platform, consulta la guida rapida di RAG per Python. | Prova il motore RAG di Gemini Enterprise Agent Platform |
Panoramica
Il motore RAG di Gemini Enterprise Agent Platform, un componente di Gemini Enterprise Agent Platform, facilita la Retrieval-Augmented Generation (RAG). Gemini Enterprise Agent Platform RAG Engine è anche un framework di dati per lo sviluppo di applicazioni basate su modelli linguistici di grandi dimensioni (LLM) con aggiunta del contesto. Questa si verifica quando un modello LLM viene applicato ai dati. È così che viene implementata la generazione Retrieval-Augmented Generation (RAG).
Un problema comune con i LLM è che non comprendono le conoscenze private, ovvero i dati della tua organizzazione. Con Gemini Enterprise Agent Platform RAG Engine, puoi arricchire il contesto dei modelli LLM con informazioni private aggiuntive, in modo che il modello possa ridurre le allucinazioni e rispondere alle domande in modo più preciso.
Combinando fonti di conoscenza aggiuntive con le conoscenze esistenti degli LLM, viene fornito un contesto migliore. Il contesto migliorato insieme alla query migliora la qualità della risposta dell'LLM.
L'immagine seguente illustra i concetti chiave per comprendere il motore RAG di Gemini Enterprise Agent Platform.

Questi concetti sono elencati nell'ordine del processo di generazione Retrieval-Augmented Generation (RAG).
Importazione dei dati: importa i dati da diverse origini dati. Ad esempio, file locali, Cloud Storage e Google Drive.
Trasformazione dei dati: Conversione dei dati in preparazione dell'indicizzazione. Ad esempio, i dati vengono divisi in blocchi.
Incorporamento: Rappresentazioni numeriche di parole o parti di testo. Questi numeri acquisiscono il significato semantico e il contesto del testo. Parole o testi simili o correlati tendono ad avere embedding simili, il che significa che sono più vicini nello spazio vettoriale di grandi dimensioni.
Indicizzazione dei dati: il motore RAG di Gemini Enterprise Agent Platform crea un indice chiamato corpus. L'indice struttura la knowledge base in modo che sia ottimizzata per la ricerca. Ad esempio, l'indice è come un sommario dettagliato per un enorme libro di consultazione.
Recupero: quando un utente pone una domanda o fornisce un prompt, il componente di recupero nel motore RAG di Gemini Enterprise Agent Platform esegue una ricerca nella sua knowledge base per trovare informazioni pertinenti alla query.
Generazione: le informazioni recuperate diventano il contesto aggiunto alla query utente originale come guida per il modello di AI generativa per generare risposte basate su fatti e pertinenti.
Aree geografiche supportate
Il motore RAG di Gemini Enterprise Agent Platform è supportato nelle seguenti regioni:
| Regione | Località | Descrizione | Fase di lancio |
|---|---|---|---|
us-central1 |
Iowa | Sono supportate le versioni v1 e v1beta1. |
Allowlist, GA |
us-east4 |
Virginia | Sono supportate le versioni v1 e v1beta1. |
Allowlist, GA |
us-east1 |
Moncks Corner, SC | Sono supportate le versioni v1 e v1beta1. |
Lista consentita, Anteprima |
europe-west3 |
Francoforte, Germania | Sono supportate le versioni v1 e v1beta1. |
GA |
europe-west4 |
Eemshaven, Paesi Bassi | Sono supportate le versioni v1 e v1beta1. |
GA |
asia-east1 |
Taiwan | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
asia-northeast1 |
Tokyo | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
asia-northeast3 |
Seul | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
asia-south1 |
Mumbai | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
asia-southeast1 |
Singapore | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-central2 |
Varsavia | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-north1 |
Finlandia | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-southwest1 |
Madrid | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-west1 |
Belgio | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-west2 |
Londra | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-west6 |
Zurigo | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-west8 |
Milano | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
europe-west9 |
Parigi | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
us-east5 |
Columbus, OH | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
us-south1 |
Dallas, TX | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
us-west1 |
Oregon | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
us-west4 |
Las Vegas, NV | Sono supportate le versioni v1 e v1beta1. |
Anteprima |
us-central1,us-east1eus-east4vengono modificati inAllowlist. Se vuoi sperimentare con RAG Engine di Gemini Enterprise Agent Platform, prova altre regioni.
Elimina RAG Engine di Gemini Enterprise Agent Platform
Per saperne di più sull'eliminazione di un motore RAG di Gemini Enterprise Agent Platform, consulta quanto segue:
API versione 1 (v1) parameters
API v1beta1 parametri
Passaggi successivi
Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività del motore RAG di Gemini Enterprise Agent Platform, consulta la guida rapida di RAG per Python.
Per scoprire di più sul grounding, consulta la Panoramica del grounding.
Per saperne di più sulle risposte di RAG, consulta
GenerateContentResponse.