Esta página descreve o que é o mecanismo RAG da plataforma de agentes do Gemini Enterprise e como ele funciona.
| Descrição | Console |
|---|---|
| Para saber como usar o SDK da Vertex AI para executar tarefas do mecanismo RAG da plataforma de agentes do Gemini Enterprise, consulte o Guia de início rápido do RAG para Python. | Testar o mecanismo RAG da Gemini Enterprise Agent Platform |
Visão geral
O mecanismo RAG da plataforma de agentes do Gemini Enterprise, um componente da plataforma de agentes do Gemini Enterprise, facilita a geração aumentada por recuperação (RAG, na sigla em inglês). O mecanismo RAG da plataforma de agentes do Gemini Enterprise também é um framework de dados para desenvolvimento de aplicativos de modelo de linguagem grande (LLM) ampliados por contexto. A ampliação de contexto ocorre quando um LLM é aplicado aos dados. Isso implementa a geração de recuperação aumentada (RAG, na sigla em inglês).
Um problema comum com os LLMs é que eles não entendem o conhecimento particular, ou seja, os dados da sua organização. Com o mecanismo RAG da Gemini Enterprise Agent Platform, é possível enriquecer o contexto do LLM com mais informações particulares, para que o modelo possa reduzir as alucinações e responder a perguntas com mais precisão.
Ao combinar outras fontes de conhecimento com o conhecimento atual que os LLMs têm, um contexto melhor é fornecido. O contexto aprimorado com a consulta melhora a qualidade da resposta do LLM.
A imagem a seguir ilustra os principais conceitos para entender o mecanismo RAG da plataforma de agentes do Gemini Enterprise.

Esses conceitos são listados na ordem do processo de geração aumentada por recuperação (RAG, na sigla em inglês).
Ingestão de dados: receba dados de diferentes fontes. Por exemplo, arquivos locais, Cloud Storage e Google Drive.
Transformação de dados: conversão dos dados na preparação para indexação. Por exemplo, os dados são divididos em partes.
Embedding: representações numéricas de palavras ou partes de texto. Esses números captam o significado semântico e o contexto do texto. Palavras ou textos semelhantes ou relacionados costumam ter embeddings parecidos, o que significa que estão mais próximos no espaço vetorial multidimensional.
Indexação de dados: o mecanismo RAG da Gemini Enterprise Agent Platform cria um índice chamado corpus. O índice estrutura a base de conhecimento para que seja otimizado para pesquisa. Por exemplo, o índice é como um sumário detalhado de um grande livro de referência.
Recuperação: quando um usuário faz uma pergunta ou fornece uma solicitação, o componente de recuperação no mecanismo RAG da Gemini Enterprise Agent Platform pesquisa em sua base de conhecimento para encontrar informações relevantes para a consulta.
Geração: as informações recuperadas se tornam o contexto adicionado à consulta do usuário original como um guia para que o modelo de IA generativa gere respostas factuais baseadas e relevantes.
Regiões compatíveis
O mecanismo RAG da plataforma de agentes do Gemini Enterprise é compatível com as seguintes regiões:
| Região | Local | Descrição | Etapa do lançamento |
|---|---|---|---|
us-central1 |
Iowa | As versões v1 e v1beta1 são compatíveis. |
Lista de permissões, GA |
us-east4 |
Virgínia | As versões v1 e v1beta1 são compatíveis. |
Lista de permissões, GA |
us-east1 |
Moncks Corner, SC | As versões v1 e v1beta1 são compatíveis. |
Lista de permissões, pré-lançamento |
europe-west3 |
Frankfurt, Alemanha | As versões v1 e v1beta1 são compatíveis. |
GA |
europe-west4 |
Eemshaven, Países Baixos | As versões v1 e v1beta1 são compatíveis. |
GA |
asia-east1 |
Taiwan | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
asia-northeast1 |
Tóquio | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
asia-northeast3 |
Seul | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
asia-south1 |
Mumbai | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
asia-southeast1 |
Singapura | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-central2 |
Varsóvia | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-north1 |
Finlândia | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-southwest1 |
Madri | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-west1 |
Bélgica | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-west2 |
Londres | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-west6 |
Zurique | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-west8 |
Milão | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
europe-west9 |
Paris | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
us-east5 |
Columbus, OH | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
us-south1 |
Dallas, TX | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
us-west1 |
Oregon | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
us-west4 |
Las Vegas, NV | As versões v1 e v1beta1 são compatíveis. |
Pré-lançamento |
us-central1,us-east1eus-east4foram alterados paraAllowlist. Se você quiser fazer experimentos com o mecanismo RAG da plataforma de agentes do Gemini Enterprise, tente outras regiões.
Excluir o mecanismo RAG da plataforma de agentes do Gemini Enterprise
Para mais informações sobre como excluir um mecanismo RAG da Gemini Enterprise Agent Platform, consulte o seguinte:
A seguir
Para saber como usar o SDK da Vertex AI para executar tarefas do mecanismo RAG da plataforma de agentes do Gemini Enterprise, consulte o Guia de início rápido do RAG para Python.
Para saber mais sobre o embasamento, consulte Visão geral do embasamento.
Para saber mais sobre as respostas do RAG, consulte
GenerateContentResponse.