Vista geral do Vertex AI RAG Engine

Esta página descreve o que é o motor RAG da Vertex AI e como funciona.

Descrição Consola
Para saber como usar o SDK Vertex AI para executar tarefas do motor RAG do Vertex AI, consulte o guia de início rápido do RAG para Python.

Experimente o Vertex AI RAG Engine

Vista geral

O Vertex AI RAG Engine, um componente da plataforma Vertex AI, facilita a geração aumentada por recuperação (RAG). O Vertex AI RAG Engine também é uma framework de dados para desenvolver aplicações de grandes modelos de linguagem (GMLs) aumentados por contexto. O enriquecimento do contexto ocorre quando aplica um MDG aos seus dados. Isto implementa a geração melhorada de texto (RAG).

Um problema comum com os MDIs é que não compreendem o conhecimento privado, ou seja, os dados da sua organização. Com o motor RAG da Vertex AI, pode enriquecer o contexto do MDG com informações privadas adicionais, porque o modelo pode reduzir as alucinações e responder a perguntas com maior precisão.

Ao combinar origens de conhecimentos adicionais com os conhecimentos existentes dos MDIs/CEs, é fornecido um contexto melhor. O contexto melhorado, juntamente com a consulta, melhora a qualidade da resposta do MDLI.

A imagem seguinte ilustra os conceitos principais para compreender o motor RAG da Vertex AI.

Principais conceitos da RAG do Vertex AI

Estes conceitos estão listados pela ordem do processo de geração aumentada de recuperação (RAG).

  1. Carregamento de dados: carregue dados de diferentes origens de dados. Por exemplo, ficheiros locais, Cloud Storage e Google Drive.

  2. Transformação de dados: Conversão dos dados na preparação para a indexação. Por exemplo, os dados são divididos em partes.

  3. Incorporação: representações numéricas de palavras ou fragmentos de texto. Estes números captam o significado semântico e o contexto do texto. As palavras ou o texto semelhantes ou relacionados tendem a ter incorporações semelhantes, o que significa que estão mais próximos no espaço vetorial de alta dimensão.

  4. Indexação de dados: o Vertex AI RAG Engine cria um índice denominado corpus. O índice estrutura a base de conhecimentos para que seja otimizado para a pesquisa. Por exemplo, o índice é como uma tabela de conteúdos detalhada para um livro de referência enorme.

  5. Obtenção: quando um utilizador faz uma pergunta ou fornece um comando, o componente de obtenção no Vertex AI RAG Engine pesquisa na respetiva base de conhecimentos para encontrar informações relevantes para a consulta.

  6. Geração: as informações obtidas tornam-se o contexto adicionado à consulta original do utilizador como um guia para o modelo de IA generativa gerar respostas fundamentadas e relevantes.

Regiões suportadas

O Vertex AI RAG Engine é suportado nas seguintes regiões:

Região Localização Descrição Fase de lançamento
us-central1 Iowa As versões v1 e v1beta1 são suportadas. Lista de autorizações
us-east4 Virgínia As versões v1 e v1beta1 são suportadas. Lista de autorizações
europe-west3 Frankfurt, Alemanha As versões v1 e v1beta1 são suportadas. DG
europe-west4 Eemshaven, Países Baixos As versões v1 e v1beta1 são suportadas. DG
asia-east1 Taiwan As versões v1 e v1beta1 são suportadas. Pré-visualização
asia-northeast1 Tóquio As versões v1 e v1beta1 são suportadas. Pré-visualização
asia-northeast3 Seul As versões v1 e v1beta1 são suportadas. Pré-visualização
asia-south1 Mumbai As versões v1 e v1beta1 são suportadas. Pré-visualização
asia-southeast1 Singapura As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-central2 Varsóvia As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-north1 Finlândia As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-southwest1 Madrid As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-west1 Bélgica As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-west2 Londres As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-west6 Zurique As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-west8 Milão As versões v1 e v1beta1 são suportadas. Pré-visualização
europe-west9 Paris As versões v1 e v1beta1 são suportadas. Pré-visualização
us-east1 Moncks Corner, SC As versões v1 e v1beta1 são suportadas. Pré-visualização
us-east5 Columbus, OH As versões v1 e v1beta1 são suportadas. Pré-visualização
us-south1 Dallas, TX As versões v1 e v1beta1 são suportadas. Pré-visualização
us-west1 Oregon As versões v1 e v1beta1 são suportadas. Pré-visualização
us-west4 Las Vegas, NV As versões v1 e v1beta1 são suportadas. Pré-visualização
  • us-central1 e us-east4 são alterados para Allowlist. Se quiser fazer experiências com o motor RAG da Vertex AI, experimente outras regiões. Se planeia integrar o seu tráfego de produção nestas regiões, contacte vertex-ai-rag-engine-support@google.com.

Elimine o Vertex AI RAG Engine

Os exemplos de código seguintes demonstram como eliminar um motor RAG do Vertex AI para a Google Cloud consola, Python e REST:

Enviar feedback

Para conversar com o apoio técnico da Google, aceda ao grupo de apoio técnico do Vertex AI RAG Engine.

Para enviar um email, use o endereço de email vertex-ai-rag-engine-support@google.com.

O que se segue?