Fundamentação com o Vertex AI Search

Esta página explica como pode fundamentar as respostas usando os seus dados do Vertex AI Search.

Fundamentar o Gemini nos seus dados

Se quiser fazer uma geração aumentada de obtenção (RAG), associe o seu modelo aos dados do seu Website ou aos seus conjuntos de documentos e, em seguida, use a Fundamentação com a Pesquisa do Vertex AI.

A fundamentação nos seus dados suporta um máximo de 10 origens de dados do Vertex AI Search e pode ser combinada com a fundamentação com a Pesquisa Google.

Modelos suportados

Esta secção apresenta os modelos que suportam a fundamentação com os seus dados.

Gemini 3 Flash pré-visualização
Gemini 3 Pro pré-visualização
Gemini 3 Pro Image pré-visualização
Gemini 2.5 Pro
Gemini 2.5 Flash pré-visualização
Gemini 2.5 Flash-Lite pré-visualização
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash com áudio nativo da API Gemini Live
Gemini 2.5 Flash com áudio nativo da API Live (pré-visualização) pré-visualização
Gemini 2.0 Flash com API Live pré-visualização
Gemini 2.0 Flash

Pré-requisitos

Antes de poder fundamentar a saída do modelo nos seus dados, faça o seguinte:

Na Google Cloud consola, aceda à página IAM e pesquise a autorização discoveryengine.servingConfigs.search, que é necessária para o serviço de fundamentação funcionar.

Aceder ao IAM

Para receber as autorizações necessárias para usar a fundamentação com o Vertex AI Search, peça ao seu administrador para lhe conceder as seguintes funções do IAM:
- Para ler todos os recursos do Discovery Engine: Discovery Engine Viewer (roles/discoveryengine.viewer).
- Para ler e escrever todos os recursos do Discovery Engine e criar uma instância do Vertex AI Search: Editor do Discovery Engine (roles/discoveryengine.editor).
Para mais informações sobre o IAM, consulte o artigo Funções e autorizações do IAM.
Ative as aplicações de IA e ative a API.
Crie uma origem de dados de aplicações de IA e uma aplicação.

Para mais informações, consulte o artigo Introdução à Vertex AI Search.

Ative as aplicações de IA

Para usar o Vertex AI Search para fundamentar as suas respostas, tem de ativar o serviço Vertex AI Search seguindo estes passos:

Na Google Cloud consola, aceda à página Aplicações de IA.

Aceda a Aplicações de IA
Opcional: reveja os termos de utilização de dados.

As aplicações de IA estão disponíveis na localização global ou na eu e na multirregião us. Para saber mais, consulte Localizações das aplicações de IA.

Crie um repositório de dados em Aplicações de IA

Para criar um arquivo de dados em Aplicações de IA, pode optar por fundamentar com dados de Websites ou documentos.

Website

Abra a página Criar loja de dados a partir da Google Cloud consola.
Na caixa Conteúdo do Website, clique em Selecionar.
É apresentado o painel Especifique os Websites para o seu arquivo de dados.
Se a opção Indexação avançada do Website não estiver selecionada, selecione a caixa de verificação Indexação avançada do Website para a ativar.
É apresentado o painel Configurar o seu repositório de dados.
Na secção Especifique padrões de URL a indexar, faça o seguinte:
- Adicione URLs para Sites a incluir.
- Opcional: adicione URLs para Sites a excluir.
Clique em Continuar.
No painel Configure o seu repositório de dados:
1. Selecione um valor na lista Localização do seu arquivo de dados.
2. Introduza um nome no campo Nome da loja de dados. O ID é gerado. Use este ID quando gerar as respostas fundamentadas com o seu armazenamento de dados. Para mais informações, consulte o artigo Gere respostas fundamentadas com o seu repositório de dados.
3. Clique em Criar.

Documentos

Abra a página Criar loja de dados a partir da Google Cloud consola.
Na caixa Cloud Storage, clique em Selecionar.
É apresentado o painel Importar dados do Cloud Storage.
Na secção Documentos não estruturados (PDF, HTML, TXT e muito mais), selecione Documentos não estruturados (PDF, HTML, TXT e muito mais).
Selecione uma opção de Frequência de sincronização.
Selecione a opção Selecione uma pasta ou um ficheiro que quer importar e introduza o caminho no campo.
Clique em Continuar.
O painel Configure a sua loja de dados é apresentado.
No painel Configure o seu repositório de dados:
1. Selecione um valor na lista Localização do seu arquivo de dados.
2. Introduza um nome no campo Nome da loja de dados. O ID é gerado.
3. Para selecionar opções de análise e divisão em blocos para os seus documentos, expanda a secção Opções de processamento de documentos. Para mais informações sobre os diferentes analisadores, consulte o artigo Analise documentos.
4. Clique em Criar.
Clique em Criar.

Gere respostas fundamentadas com o seu repositório de dados

Use as instruções seguintes para fundamentar um modelo com os seus dados. É suportado um máximo de 10 arquivos de dados.

Se não souber o ID da loja de dados, siga estes passos:

Na Google Cloud consola, aceda à página Aplicações de IA e, no menu de navegação, clique em Armazenamentos de dados.

Aceda à página Armazenamentos de dados
Clique no nome do arquivo de dados.
Na página Dados da sua loja de dados, obtenha o ID da loja de dados.

Consola

Para fundamentar a saída do modelo nas aplicações de IA através do Vertex AI Studio na Google Cloud consola, siga estes passos:

Na Google Cloud consola, aceda à página Vertex AI Studio.
Aceda ao Vertex AI Studio

Para ativar a fundamentação, siga estes passos:

Clique em + Novo e Chat no menu de navegação.
Expanda o painel Definições do modelo e selecione o seu modelo.
Opcional: se o botão Saída estruturada ou Fundamentação: Google estiver ativado, desative a opção.
Clique no botão Fundamentação: os seus dados. É apresentado o painel Personalizar base.

Selecione uma opção de origem de base na tabela seguinte:

Opção de fundamentação	Descrição	Entrada
Vertex AI RAG Engine	Motivos para usar os seus dados e componentes de criação própria.	Se não tiver um corpus, tem de criar um. Caso contrário, introduza o seu corpus.
Vertex AI Search	Fundamente a utilização dos seus dados com um motor de pesquisa gerido pela Google.	Introduza o caminho no campo Caminho do datastore do Vertex AI.
Elasticsearch	Motivos para usar o Elasticsearch.	Introduza as seguintes informações: Introduza um valor no campo Ponto final do Elasticsearch. Introduza um valor no campo Chave da API Elasticsearch. Introduza um valor no campo Índice do Elasticsearch. Introduza um valor no campo Modelo de pesquisa do Elasticsearch.

Clique em Guardar.

Introduza o comando na caixa de texto e clique em Enviar. As respostas aos seus comandos baseiam-se em aplicações de IA.

Python

Instalação

pip install --upgrade google-genai

Para saber mais, consulte a documentação de referência do SDK.

Defina variáveis de ambiente para usar o SDK de IA gen com o Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    GenerateContentConfig,
    VertexAISearch,
    Retrieval,
    Tool,
    HttpOptions,
)

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Replace with your Vertex AI Search data store details
DATASTORE_PATH = "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATASTORE_ID"

tool = Tool(
    retrieval=Retrieval(
        vertex_ai_search=VertexAISearch(
            datastore=DATASTORE_PATH
        )
    )
)

response = client.models.generate_content(
    model="gemini-2.5-flash",  # Or another supported model
    contents="What information can you find about topic X in the provided documents?", # Your query
    config=GenerateContentConfig(
        tools=[tool],
    ),
)

print(response.text)

REST

Para testar um comando de texto através da API Vertex AI, envie um pedido POST para o ponto final do modelo do publicador.

Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:

LOCATION: a região para processar o pedido. Para usar o global endpoint, exclua a localização do nome do endpoint e configure a localização do recurso para global.
PROJECT_ID: o seu ID do projeto.
MODEL_ID: o ID do modelo multimodal.
PROMPT: o comando a enviar para o modelo.

Método HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON do pedido:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "PROMPT"
    }]
  }],
  "tools": [{
    "retrieval": {
      "vertexAiSearch": {
        "datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATASTORE_ID
      }
    }
  }],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Para enviar o seu pedido, expanda uma destas opções:

curl (Linux, macOS ou Cloud Shell)

Nota: O comando seguinte pressupõe que tem sessão iniciada na CLI do gcloud com a sua conta de utilizador executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que inicia automaticamente sessão na CLI do gcloud. Pode verificar a conta atualmente ativa executando o comando gcloud auth list.

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Nota: O comando seguinte pressupõe que iniciou sessão na CLI do Google Ads com a sua conta de utilizador executando gcloud init ou gcloud auth login .gcloud Pode verificar a conta atualmente ativa executando o comando gcloud auth list.

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Deve receber uma resposta JSON semelhante à seguinte:

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "You can make an appointment on the website https://dmv.gov/"
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": [
        "..."
      ],
      "groundingMetadata": {
        "retrievalQueries": [
          "How to make appointment to renew driving license?"
        ],
        "groundingChunks": [
          {
            "retrievedContext": {
              "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==",
              "title": "dmv"
            }
          }
        ],
        "groundingSupport": [
          {
            "segment": {
              "startIndex": 25,
              "endIndex": 147
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1, 2],
            "confidenceScore": [0.9541752, 0.97726375]
          },
          {
            "segment": {
              "startIndex": 294,
              "endIndex": 439
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1],
            "confidenceScore": [0.9541752, 0.9325467]
          }
        ]
      }
    }
  ],
  "usageMetadata": {
    "..."
  }
}

Compreenda a sua resposta

A resposta de ambas as APIs inclui o texto gerado pelo MDI/CE, que se denomina candidato. Se o comando do modelo for fundamentado com êxito na sua origem de dados, as respostas incluem metadados de fundamentação, que identificam as partes da resposta que foram derivadas dos seus dados. No entanto, existem vários motivos pelos quais estes metadados podem não ser fornecidos e a resposta do comando não é fundamentada. Estes motivos incluem baixa relevância da fonte ou informações incompletas na resposta do modelo.

Segue-se uma análise detalhada dos dados de saída:

Função: indica o remetente da resposta fundamentada. Uma vez que a resposta contém sempre texto fundamentado, a função é sempre model.
Texto: a resposta fundamentada gerada pelo MDI/CE.
Metadados de fundamentação: informações sobre a origem da fundamentação, que contém os seguintes elementos:
- Fragmentos de fundamentação: uma lista de resultados do seu índice que fundamentam a resposta.
- Fundamentação suportada: informações sobre uma reivindicação específica na resposta que podem ser usadas para mostrar citações:
- Segmento: a parte da resposta do modelo que é fundamentada por um fragmento de base.
- Índice do fragmento de fundamentação: o índice dos fragmentos de fundamentação na lista de fragmentos de fundamentação que corresponde a esta reivindicação.
- Pontuações de confiança: um número de 0 a 1 que indica o grau de fundamentação da reivindicação no conjunto de fragmentos de fundamentação fornecido. Não está disponível para o Gemini 2.5 e posteriores.

O que se segue?

Para saber como enviar pedidos de comandos de chat, consulte o artigo Chat com várias interações.
Para saber mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI, consulte o artigo Práticas recomendadas de segurança.

Fundamentação com o Vertex AI Search Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Fundamentar o Gemini nos seus dados

Modelos suportados

Pré-requisitos

Ative as aplicações de IA

Crie um repositório de dados em Aplicações de IA

Website

Documentos

Gere respostas fundamentadas com o seu repositório de dados

Consola

Python

Instalação

REST

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Compreenda a sua resposta

O que se segue?

Fundamentação com o Vertex AI Search