En esta página, se describe qué es Gemini Enterprise Agent Platform RAG Engine y cómo funciona.
| Descripción | Consola |
|---|---|
| Si deseas obtener información para usar el SDK de Vertex AI para ejecutar tareas de Gemini Enterprise Agent Platform RAG Engine, consulta la Guía de inicio rápido de RAG para Python. | Probar Gemini Enterprise Agent Platform RAG Engine |
Descripción general
Gemini Enterprise Agent Platform RAG Engine, un componente de Gemini Enterprise Agent Platform, facilita la generación mejorada por recuperación (RAG). Gemini Enterprise Agent Platform RAG Engine también es un framework de datos para desarrollar aplicaciones de modelos de lenguaje grandes (LLM) adaptados al contexto. El aumento del contexto se produce cuando se aplica un LLM a tus datos. Esto implemente generación aumentada y de recuperación (RAG).
Un problema común con los LLM es que no comprenden el conocimiento privado, es decir, los datos de tu organización. Con Gemini Enterprise Agent Platform RAG Engine, puedes enriquecer el contexto del LLM con información privada adicional para que el modelo pueda reducir las alucinaciones y responder a las preguntas con mayor precisión.
Cuando se combinan fuentes de conocimiento adicionales con el conocimiento existente que tienen los LLM, se proporciona un mejor contexto. El contexto mejorado junto con la consulta mejora la calidad de la respuesta del LLM.
En la siguiente imagen, se ilustran los conceptos clave para comprender Gemini Enterprise Agent Platform RAG Engine.

Estos conceptos se enumeran en el orden del proceso de Generación mejorada por recuperación (RAG).
Ingesta de datos: Ingesta datos de diferentes fuentes de datos. Por ejemplo, archivos locales, Cloud Storage y Google Drive.
**Transformación de datos**: Conversión de los datos en preparación para la indexación. Por ejemplo, los datos se dividen en fragmentos.
Embedding: Representaciones numéricas de palabras o fragmentos de texto. Estos números capturan el significado semántico y el contexto del texto. Las palabras o textos similares o relacionados tienden a tener incrustaciones similares, lo que significa que están más cerca unas de otras en el espacio vectorial de alta dimensión.
Indexación de datos: Gemini Enterprise Agent Platform RAG Engine crea un índice llamado un corpus. El índice estructura la base de conocimientos para optimizar la búsqueda. Por ejemplo, el índice es como el índice detallado de un libro de consulta masiva.
Recuperación: Cuando un usuario hace una pregunta o proporciona una instrucción, el componente de recuperación en Gemini Enterprise Agent Platform RAG Engine busca en su base de conocimiento la información relevante para la consulta.
Generación: La información recuperada se convierte en el contexto que se agrega a la consulta original del usuario como guía para que el modelo de IA generativa genere respuestas pertinentes y basadas en hechos y relevantes.
Regiones admitidas
Gemini Enterprise Agent Platform RAG Engine se admite en las siguientes regiones:
| Región | Ubicación | Descripción | Etapa de lanzamiento |
|---|---|---|---|
us-central1 |
Iowa | Se admiten las versiones v1 y v1beta1. |
Lista de entidades permitidas, DG |
us-east4 |
Virginia | Se admiten las versiones v1 y v1beta1. |
Lista de entidades permitidas, DG |
us-east1 |
Moncks Corner, SC | Se admiten las versiones v1 y v1beta1. |
Lista de entidades permitidas, vista previa |
europe-west3 |
Fráncfort, Alemania | Se admiten las versiones v1 y v1beta1. |
GA |
europe-west4 |
Puerto de Ems, Países Bajos | Se admiten las versiones v1 y v1beta1. |
GA |
asia-east1 |
Taiwán | Se admiten las versiones v1 y v1beta1. |
Vista previa |
asia-northeast1 |
Tokio | Se admiten las versiones v1 y v1beta1. |
Vista previa |
asia-northeast3 |
Seúl | Se admiten las versiones v1 y v1beta1. |
Vista previa |
asia-south1 |
Bombay | Se admiten las versiones v1 y v1beta1. |
Vista previa |
asia-southeast1 |
Singapur | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-central2 |
Varsovia | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-north1 |
Finlandia | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-southwest1 |
Madrid | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-west1 |
Bélgica | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-west2 |
Londres | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-west6 |
Zúrich | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-west8 |
Milán | Se admiten las versiones v1 y v1beta1. |
Vista previa |
europe-west9 |
París | Se admiten las versiones v1 y v1beta1. |
Vista previa |
us-east5 |
Columbus, OH | Se admiten las versiones v1 y v1beta1. |
Vista previa |
us-south1 |
Dallas, TX | Se admiten las versiones v1 y v1beta1. |
Vista previa |
us-west1 |
Oregón | Se admiten las versiones v1 y v1beta1. |
Vista previa |
us-west4 |
Las Vegas, NV | Se admiten las versiones v1 y v1beta1. |
Vista previa |
us-central1,us-east1yus-east4cambiaron aAllowlist. Si quieres experimentar con Gemini Enterprise Agent Platform RAG Engine, prueba otras regiones.
Borra Gemini Enterprise Agent Platform RAG Engine
Para obtener más información sobre cómo borrar un Gemini Enterprise Agent Platform RAG Engine, consulta lo siguiente:
¿Qué sigue?
Si deseas obtener información para usar el SDK de Vertex AI para ejecutar tareas de Gemini Enterprise Agent Platform RAG Engine, consulta la Guía de inicio rápido de RAG para Python.
Para obtener más información sobre la fundamentación, consulta Descripción general de la fundamentación.
Para obtener más información sobre las respuestas de RAG, consulta
GenerateContentResponse.