Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Visão geral do mecanismo RAG na plataforma de agentes do Gemini Enterprise

Nesta página, descrevemos o que é o RAG Engine e como ele funciona.

Descrição	Console
Para saber como usar o SDK da Vertex AI para executar o mecanismo de RAG em tarefas da Gemini Enterprise Agent Platform, consulte o guia de início rápido da RAG para Python.	Testar o mecanismo RAG

Visão geral

O mecanismo RAG, um componente da Gemini Enterprise Agent Platform, facilita a geração aumentada por recuperação (RAG). O mecanismo RAG também é um framework de dados para desenvolver aplicativos de modelo de linguagem grande (LLM) ampliados por contexto. A ampliação de contexto ocorre quando você aplica um LLM aos seus dados. Isso implementa a geração de recuperação aumentada (RAG, na sigla em inglês).

Um problema comum com os LLMs é que eles não entendem o conhecimento particular, ou seja, os dados da sua organização. Com o mecanismo de RAG, é possível enriquecer o contexto do LLM com mais informações particulares para que o modelo reduza as alucinações e responda a perguntas com mais precisão.

Ao combinar outras fontes de conhecimento com o conhecimento atual que os LLMs têm, um contexto melhor é fornecido. O contexto aprimorado com a consulta melhora a qualidade da resposta do LLM.

A imagem a seguir ilustra os principais conceitos para entender o RAG Engine.

Principais conceitos da RAG da Agent Platform

Esses conceitos são listados na ordem do processo de geração aumentada por recuperação (RAG).

Ingestão de dados: ingira dados de diferentes fontes. Por exemplo, arquivos locais, Cloud Storage e Google Drive.
Transformação de dados: conversão dos dados na preparação para indexação. Por exemplo, os dados são particionados.
Embedding: representações numéricas de palavras ou partes de texto. Esses números captam o significado semântico e o contexto do texto. Palavras ou textos semelhantes ou relacionados costumam ter embeddings parecidos, o que significa que estão mais próximos no espaço vetorial multidimensional.
Indexação de dados: o mecanismo RAG cria um índice chamado corpus. O índice estrutura a base de conhecimento para que seja otimizado para pesquisa. Por exemplo, o índice é como um índice detalhado de um grande livro de referência.
Recuperação: quando um usuário faz uma pergunta ou fornece uma solicitação, o componente de recuperação no RAG Engine pesquisa na base de conhecimento para encontrar informações relevantes para a consulta.
Geração: as informações recuperadas se tornam o contexto adicionado à consulta do usuário original como um guia para que o modelo de IA generativa gere respostas factuais baseadas e relevantes.

Regiões compatíveis

O RAG Engine está disponível nas seguintes regiões:

Região	Local	Descrição	Etapa do lançamento
`us-central1`	Iowa	As versões `v1` e `v1beta1` são compatíveis.	Lista de permissões, GA
`us-east4`	Virgínia	As versões `v1` e `v1beta1` são compatíveis.	Lista de permissões, GA
`us-east1`	Moncks Corner, SC	As versões `v1` e `v1beta1` são compatíveis.	Lista de permissões, pré-lançamento
`europe-west3`	Frankfurt, Alemanha	As versões `v1` e `v1beta1` são compatíveis.	GA
`europe-west4`	Eemshaven, Países Baixos	As versões `v1` e `v1beta1` são compatíveis.	GA
`asia-east1`	Taiwan	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`asia-northeast1`	Tóquio	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`asia-northeast3`	Seul	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`asia-south1`	Mumbai	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`asia-southeast1`	Singapura	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-central2`	Varsóvia	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-north1`	Finlândia	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-southwest1`	Madri	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-west1`	Bélgica	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-west2`	Londres	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-west6`	Zurique	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-west8`	Milão	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`europe-west9`	Paris	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`us-east5`	Columbus, OH	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`us-south1`	Dallas, TX	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`us-west1`	Oregon	As versões `v1` e `v1beta1` são compatíveis.	Visualizar
`us-west4`	Las Vegas, NV	As versões `v1` e `v1beta1` são compatíveis.	Visualizar

us-central1, us-east1 e us-east4 são alterados para Allowlist. Se você quiser testar o RAG Engine, tente outras regiões.

Excluir mecanismo RAG

Para mais informações sobre como excluir um mecanismo RAG, consulte o seguinte:

API versão 1 (v1) parameters
Parâmetros da API v1beta1

A seguir

Para saber como usar o SDK da Vertex AI para executar o mecanismo de RAG em tarefas da Gemini Enterprise Agent Platform, consulte o guia de início rápido da RAG para Python.
Para saber mais sobre o embasamento, consulte Visão geral do embasamento.
Para saber mais sobre as respostas da RAG, consulte GenerateContentResponse.