Visão geral do mecanismo RAG na plataforma de agentes do Gemini Enterprise

Nesta página, descrevemos o que é o RAG Engine e como ele funciona.

Descrição Console
Para saber como usar o SDK da Vertex AI para executar o mecanismo de RAG em tarefas da Gemini Enterprise Agent Platform, consulte o guia de início rápido da RAG para Python. Testar o mecanismo RAG

Visão geral

O mecanismo RAG, um componente da Gemini Enterprise Agent Platform, facilita a geração aumentada por recuperação (RAG). O mecanismo RAG também é um framework de dados para desenvolver aplicativos de modelo de linguagem grande (LLM) ampliados por contexto. A ampliação de contexto ocorre quando você aplica um LLM aos seus dados. Isso implementa a geração de recuperação aumentada (RAG, na sigla em inglês).

Um problema comum com os LLMs é que eles não entendem o conhecimento particular, ou seja, os dados da sua organização. Com o mecanismo de RAG, é possível enriquecer o contexto do LLM com mais informações particulares para que o modelo reduza as alucinações e responda a perguntas com mais precisão.

Ao combinar outras fontes de conhecimento com o conhecimento atual que os LLMs têm, um contexto melhor é fornecido. O contexto aprimorado com a consulta melhora a qualidade da resposta do LLM.

A imagem a seguir ilustra os principais conceitos para entender o RAG Engine.

Principais conceitos da RAG da Agent Platform

Esses conceitos são listados na ordem do processo de geração aumentada por recuperação (RAG).

  1. Ingestão de dados: ingira dados de diferentes fontes. Por exemplo, arquivos locais, Cloud Storage e Google Drive.

  2. Transformação de dados: conversão dos dados na preparação para indexação. Por exemplo, os dados são particionados.

  3. Embedding: representações numéricas de palavras ou partes de texto. Esses números captam o significado semântico e o contexto do texto. Palavras ou textos semelhantes ou relacionados costumam ter embeddings parecidos, o que significa que estão mais próximos no espaço vetorial multidimensional.

  4. Indexação de dados: o mecanismo RAG cria um índice chamado corpus. O índice estrutura a base de conhecimento para que seja otimizado para pesquisa. Por exemplo, o índice é como um índice detalhado de um grande livro de referência.

  5. Recuperação: quando um usuário faz uma pergunta ou fornece uma solicitação, o componente de recuperação no RAG Engine pesquisa na base de conhecimento para encontrar informações relevantes para a consulta.

  6. Geração: as informações recuperadas se tornam o contexto adicionado à consulta do usuário original como um guia para que o modelo de IA generativa gere respostas factuais baseadas e relevantes.

Regiões compatíveis

O RAG Engine está disponível nas seguintes regiões:

Região Local Descrição Etapa do lançamento
us-central1 Iowa As versões v1 e v1beta1 são compatíveis. Lista de permissões, GA
us-east4 Virgínia As versões v1 e v1beta1 são compatíveis. Lista de permissões, GA
us-east1 Moncks Corner, SC As versões v1 e v1beta1 são compatíveis. Lista de permissões, pré-lançamento
europe-west3 Frankfurt, Alemanha As versões v1 e v1beta1 são compatíveis. GA
europe-west4 Eemshaven, Países Baixos As versões v1 e v1beta1 são compatíveis. GA
asia-east1 Taiwan As versões v1 e v1beta1 são compatíveis. Visualizar
asia-northeast1 Tóquio As versões v1 e v1beta1 são compatíveis. Visualizar
asia-northeast3 Seul As versões v1 e v1beta1 são compatíveis. Visualizar
asia-south1 Mumbai As versões v1 e v1beta1 são compatíveis. Visualizar
asia-southeast1 Singapura As versões v1 e v1beta1 são compatíveis. Visualizar
europe-central2 Varsóvia As versões v1 e v1beta1 são compatíveis. Visualizar
europe-north1 Finlândia As versões v1 e v1beta1 são compatíveis. Visualizar
europe-southwest1 Madri As versões v1 e v1beta1 são compatíveis. Visualizar
europe-west1 Bélgica As versões v1 e v1beta1 são compatíveis. Visualizar
europe-west2 Londres As versões v1 e v1beta1 são compatíveis. Visualizar
europe-west6 Zurique As versões v1 e v1beta1 são compatíveis. Visualizar
europe-west8 Milão As versões v1 e v1beta1 são compatíveis. Visualizar
europe-west9 Paris As versões v1 e v1beta1 são compatíveis. Visualizar
us-east5 Columbus, OH As versões v1 e v1beta1 são compatíveis. Visualizar
us-south1 Dallas, TX As versões v1 e v1beta1 são compatíveis. Visualizar
us-west1 Oregon As versões v1 e v1beta1 são compatíveis. Visualizar
us-west4 Las Vegas, NV As versões v1 e v1beta1 são compatíveis. Visualizar
  • us-central1, us-east1 e us-east4 são alterados para Allowlist. Se você quiser testar o RAG Engine, tente outras regiões.

Excluir mecanismo RAG

Para mais informações sobre como excluir um mecanismo RAG, consulte o seguinte:

  • API versão 1 (v1) parameters

  • Parâmetros da API v1beta1

A seguir