Información general sobre el motor de RAG de Vertex AI

En esta página se describe qué es Vertex AI RAG Engine y cómo funciona.

Descripción Consola
Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.

Probar Vertex AI RAG Engine

Información general

Vertex AI RAG Engine, un componente de la plataforma Vertex AI, facilita la generación aumentada de recuperación (RAG). Vertex AI RAG Engine también es un marco de datos para desarrollar aplicaciones de modelos de lenguaje extensos (LLMs) con contexto aumentado. El aumento del contexto se produce cuando aplicas un LLM a tus datos. Implementa la generación aumentada por recuperación (RAG).

Un problema habitual de los LLMs es que no entienden el conocimiento privado, es decir, los datos de tu organización. Con Vertex AI RAG Engine, puedes enriquecer el contexto de los LLMs con información privada adicional, ya que el modelo puede reducir las alucinaciones y responder a las preguntas de forma más precisa.

Al combinar fuentes de conocimiento adicionales con el conocimiento que ya tienen los LLMs, se proporciona un mejor contexto. El contexto mejorado junto con la consulta aumenta la calidad de la respuesta del LLM.

En la siguiente imagen se muestran los conceptos clave para entender Vertex AI RAG Engine.

Conceptos clave de RAG de Vertex AI

Estos conceptos se enumeran en el orden del proceso de generación aumentada de recuperación (RAG).

  1. Ingestión de datos: ingiere datos de diferentes fuentes. Por ejemplo, archivos locales, Cloud Storage y Google Drive.

  2. Transformación de datos: conversión de los datos para prepararlos para la indexación. Por ejemplo, los datos se dividen en fragmentos.

  3. Inserción: representaciones numéricas de palabras o fragmentos de texto. Estos números capturan el significado semántico y el contexto del texto. Las palabras o el texto similares o relacionados tienden a tener inserciones similares, lo que significa que están más cerca en el espacio vectorial de alta dimensión.

  4. Indexación de datos: Vertex AI RAG Engine crea un índice llamado corpus. El índice estructura la base de conocimientos para que esté optimizada para las búsquedas. Por ejemplo, el índice es como una tabla de contenido detallada de un libro de referencia enorme.

  5. Extracción: cuando un usuario hace una pregunta o proporciona una petición, el componente de extracción de Vertex AI RAG Engine busca en su base de conocimientos información relevante para la consulta.

  6. Generación: la información obtenida se convierte en el contexto que se añade a la consulta original del usuario como guía para que el modelo de IA generativa genere respuestas fundamentadas y relevantes.

Regiones disponibles

Vertex AI RAG Engine está disponible en las siguientes regiones:

Región Ubicación Descripción Fase de lanzamiento
us-central1 Iowa Se admiten las versiones v1 y v1beta1. Lista de permitidos
us-east4 Virginia Se admiten las versiones v1 y v1beta1. Lista de permitidos
europe-west3 Fráncfort (Alemania) Se admiten las versiones v1 y v1beta1. GA
europe-west4 Eemshaven (Países Bajos) Se admiten las versiones v1 y v1beta1. GA
asia-east1 Taiwán Se admiten las versiones v1 y v1beta1. Vista previa
asia-northeast1 Tokio Se admiten las versiones v1 y v1beta1. Vista previa
asia-northeast3 Seúl Se admiten las versiones v1 y v1beta1. Vista previa
asia-south1 Bombay Se admiten las versiones v1 y v1beta1. Vista previa
asia-southeast1 Singapur Se admiten las versiones v1 y v1beta1. Vista previa
europe-central2 Varsovia Se admiten las versiones v1 y v1beta1. Vista previa
europe-north1 Finlandia Se admiten las versiones v1 y v1beta1. Vista previa
europe-southwest1 Madrid Se admiten las versiones v1 y v1beta1. Vista previa
europe-west1 Bélgica Se admiten las versiones v1 y v1beta1. Vista previa
europe-west2 Londres Se admiten las versiones v1 y v1beta1. Vista previa
europe-west6 Zúrich Se admiten las versiones v1 y v1beta1. Vista previa
europe-west8 Milán Se admiten las versiones v1 y v1beta1. Vista previa
europe-west9 París Se admiten las versiones v1 y v1beta1. Vista previa
us-east1 Moncks Corner (Carolina del Sur) Se admiten las versiones v1 y v1beta1. Vista previa
us-east5 Columbus (Ohio) Se admiten las versiones v1 y v1beta1. Vista previa
us-south1 Dallas, Texas Se admiten las versiones v1 y v1beta1. Vista previa
us-west1 Oregón Se admiten las versiones v1 y v1beta1. Vista previa
us-west4 Las Vegas (Nevada) Se admiten las versiones v1 y v1beta1. Vista previa
  • us-central1 y us-east4 se han cambiado a Allowlist. Si quieres experimentar con Vertex AI RAG Engine, prueba con otras regiones. Si tienes previsto incorporar tu tráfico de producción a estas regiones, ponte en contacto con vertex-ai-rag-engine-support@google.com.

Eliminar Vertex AI RAG Engine

En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI para la Google Cloud consola, Python y REST:

Enviar comentarios

Para chatear con el equipo de Asistencia de Google, ve al grupo de asistencia de Vertex AI RAG Engine.

Para enviar un correo, usa la dirección de correo vertex-ai-rag-engine-support@google.com.

Siguientes pasos