Visão geral do mecanismo RAG da plataforma de agentes do Gemini Enterprise

Esta página descreve o que é o mecanismo RAG da plataforma de agentes do Gemini Enterprise e como ele funciona.

Descrição Console
Para saber como usar o SDK da Vertex AI para executar tarefas do mecanismo RAG da plataforma de agentes do Gemini Enterprise, consulte o Guia de início rápido do RAG para Python. Testar o mecanismo RAG da Gemini Enterprise Agent Platform

Visão geral

O mecanismo RAG da plataforma de agentes do Gemini Enterprise, um componente da plataforma de agentes do Gemini Enterprise, facilita a geração aumentada por recuperação (RAG, na sigla em inglês). O mecanismo RAG da plataforma de agentes do Gemini Enterprise também é um framework de dados para desenvolvimento de aplicativos de modelo de linguagem grande (LLM) ampliados por contexto. A ampliação de contexto ocorre quando um LLM é aplicado aos dados. Isso implementa a geração de recuperação aumentada (RAG, na sigla em inglês).

Um problema comum com os LLMs é que eles não entendem o conhecimento particular, ou seja, os dados da sua organização. Com o mecanismo RAG da Gemini Enterprise Agent Platform, é possível enriquecer o contexto do LLM com mais informações particulares, para que o modelo possa reduzir as alucinações e responder a perguntas com mais precisão.

Ao combinar outras fontes de conhecimento com o conhecimento atual que os LLMs têm, um contexto melhor é fornecido. O contexto aprimorado com a consulta melhora a qualidade da resposta do LLM.

A imagem a seguir ilustra os principais conceitos para entender o mecanismo RAG da plataforma de agentes do Gemini Enterprise.

Principais conceitos da RAG da Agent Platform

Esses conceitos são listados na ordem do processo de geração aumentada por recuperação (RAG, na sigla em inglês).

  1. Ingestão de dados: receba dados de diferentes fontes. Por exemplo, arquivos locais, Cloud Storage e Google Drive.

  2. Transformação de dados: conversão dos dados na preparação para indexação. Por exemplo, os dados são divididos em partes.

  3. Embedding: representações numéricas de palavras ou partes de texto. Esses números captam o significado semântico e o contexto do texto. Palavras ou textos semelhantes ou relacionados costumam ter embeddings parecidos, o que significa que estão mais próximos no espaço vetorial multidimensional.

  4. Indexação de dados: o mecanismo RAG da Gemini Enterprise Agent Platform cria um índice chamado corpus. O índice estrutura a base de conhecimento para que seja otimizado para pesquisa. Por exemplo, o índice é como um sumário detalhado de um grande livro de referência.

  5. Recuperação: quando um usuário faz uma pergunta ou fornece uma solicitação, o componente de recuperação no mecanismo RAG da Gemini Enterprise Agent Platform pesquisa em sua base de conhecimento para encontrar informações relevantes para a consulta.

  6. Geração: as informações recuperadas se tornam o contexto adicionado à consulta do usuário original como um guia para que o modelo de IA generativa gere respostas factuais baseadas e relevantes.

Regiões compatíveis

O mecanismo RAG da plataforma de agentes do Gemini Enterprise é compatível com as seguintes regiões:

Região Local Descrição Etapa do lançamento
us-central1 Iowa As versões v1 e v1beta1 são compatíveis. Lista de permissões, GA
us-east4 Virgínia As versões v1 e v1beta1 são compatíveis. Lista de permissões, GA
us-east1 Moncks Corner, SC As versões v1 e v1beta1 são compatíveis. Lista de permissões, pré-lançamento
europe-west3 Frankfurt, Alemanha As versões v1 e v1beta1 são compatíveis. GA
europe-west4 Eemshaven, Países Baixos As versões v1 e v1beta1 são compatíveis. GA
asia-east1 Taiwan As versões v1 e v1beta1 são compatíveis. Pré-lançamento
asia-northeast1 Tóquio As versões v1 e v1beta1 são compatíveis. Pré-lançamento
asia-northeast3 Seul As versões v1 e v1beta1 são compatíveis. Pré-lançamento
asia-south1 Mumbai As versões v1 e v1beta1 são compatíveis. Pré-lançamento
asia-southeast1 Singapura As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-central2 Varsóvia As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-north1 Finlândia As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-southwest1 Madri As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-west1 Bélgica As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-west2 Londres As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-west6 Zurique As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-west8 Milão As versões v1 e v1beta1 são compatíveis. Pré-lançamento
europe-west9 Paris As versões v1 e v1beta1 são compatíveis. Pré-lançamento
us-east5 Columbus, OH As versões v1 e v1beta1 são compatíveis. Pré-lançamento
us-south1 Dallas, TX As versões v1 e v1beta1 são compatíveis. Pré-lançamento
us-west1 Oregon As versões v1 e v1beta1 são compatíveis. Pré-lançamento
us-west4 Las Vegas, NV As versões v1 e v1beta1 são compatíveis. Pré-lançamento
  • us-central1, us-east1 e us-east4 foram alterados para Allowlist. Se você quiser fazer experimentos com o mecanismo RAG da plataforma de agentes do Gemini Enterprise, tente outras regiões.

Excluir o mecanismo RAG da plataforma de agentes do Gemini Enterprise

Para mais informações sobre como excluir um mecanismo RAG da Gemini Enterprise Agent Platform, consulte o seguinte:

  • Parâmetros da API da versão 1 (v1)

  • Parâmetros da API v1beta1

A seguir