Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Embasamento com a Pesquisa Google Paralela na Web

A Parallel Web Systems oferece uma API de pesquisa que dá acesso a dados da Web disponíveis publicamente e otimizados para uso por modelos de linguagem grandes para embasamento. Nesta página, explicamos como restringir as respostas do Gemini usando o Parallel.

O embasamento com a Parallel na plataforma de agentes do Gemini Enterprise é uma oferta separada (conforme definido no seu contrato Google Cloud ) que conecta os modelos do Gemini a dados da Web públicos fornecidos pela API de pesquisa da Parallel Web Systems. Esse serviço dá ao Gemini acesso a informações atualizadas de bilhões de páginas da Web para garantir respostas mais atuais e factuais.

Observação: o uso do Parallel exige que o Google Cloud envie determinados dados do cliente à oferta separada do Parallel para processamento. O uso do serviço Parallel é regido pelos termos de uso separados do Parallel e pela política de uso aceitável do Parallel.

Casos de uso

O embasamento com Parallel é adequado para casos de uso como os seguintes:

Usar dados da Web para fins de conclusão ou enriquecimento de informações.
Agentes de várias etapas que exigem pesquisas na Web mais detalhadas para perguntas mais complexas.
Criar uma API que integra dados de pesquisa na Web.
Assistentes voltados para funcionários que permitem aos usuários finais fazer perguntas e criar relatórios complexos usando as informações mais recentes da Web.
Aplicativos voltados ao consumidor, como varejo e viagens, que permitem ao usuário tomar decisões de compra fundamentadas.
Agentes automatizados que são executados de forma autônoma para realizar tarefas automatizadas, como análise de notícias e verificações de KYC.
Agentes verticais (de vendas, programação, finanças) recebendo o contexto mais recente e atualizado da Web.

Exemplo

Quem ganhou o Grande Prêmio de F1 de Las Vegas de 2025?

Sem embasamento	Com embasamento
O Grande Prêmio de Las Vegas de 2025 ainda não aconteceu. A corrida está programada para acontecer no fim de semana de 20 a 22 de novembro de 2025. Portanto, o vencedor é desconhecido.	O vencedor do Grande Prêmio de F1 de Las Vegas de 2025 foi Max Verstappen, da Red Bull Racing. A corrida aconteceu em 22 de novembro de 2025. Fontes:domínio1.com, domínio2.com, ...

Modelos compatíveis

O embasamento com a Pesquisa Google Paralela na Web é compatível com os seguintes modelos:

Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 3.1 Pro (gemini-3.1-pro-preview)
Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Antes de começar

Para usar o embasamento com o Parallel, você precisa receber uma chave de API do site do Parallel. Essa chave é usada na sua solicitação ao Gemini.

Embasar respostas do Gemini com o recurso Paralelo

Solicite respostas embasadas do Gemini usando a API REST da seguinte forma. Para ter o melhor desempenho, recomendamos usar as configurações padrão para parâmetros opcionais, a menos que você precise de valores diferentes.

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

LOCATION: a região para processar a solicitação. Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como "global".
PROJECT_ID: o ID do projeto do Google Cloud .
MODEL_ID: o ID do modelo que será usado.
TEXT: o comando de texto a ser enviado para o modelo.
API_KEY: sua chave de API para a Pesquisa com IA paralela.
EXCLUDE_DOMAINS: opcional. Lista de domínios a serem excluídos das fontes de embasamento. Se especificado, as fontes desses domínios serão excluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto ( .gov, .edu, .co.uk). É possível especificar até 10 domínios.
INCLUDE_DOMAINS: opcional. Lista de domínios a serem incluídos nas fontes de embasamento. Se especificado, as fontes desses domínios serão incluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto (.gov, .edu, .co.uk). É possível especificar até 10 domínios.
MAX_CHARS_PER_RESULT: opcional. O número máximo de caracteres a serem incluídos em cada trecho de resultado da pesquisa. Se não for especificado, o padrão será 30000. O intervalo permitido é [1000, 100000].
MAX_CHARS_TOTAL: opcional. O número máximo total de caracteres de todos os trechos de resultados da pesquisa. Se não for especificado, 100000 será usado como padrão para . O intervalo permitido é [1000, 1000000].
MAX_RESULTS: opcional. O número máximo de resultados da pesquisa a serem usados para embasamento. Se não for especificado, 10 será usado como padrão para . O intervalo permitido é [1, 20].
MODE (opcional): modo a ser usado na solicitação, one-shot ou fast. O padrão é one-shot. Considere o modo fast se quiser otimizar a latência.
SEARCH_LOCATION: opcional: código do país ISO 3166-1 alfa-2 para resultados de pesquisa segmentados por região geográfica. Exemplo: "us".

Método HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON da solicitação:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "mode": "MODE",
            "location": "SEARCH_LOCATION",
            "max_results": MAX_RESULTS,
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            }
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Para enviar a solicitação, expanda uma destas opções:

curl (Linux, macOS ou Cloud Shell)

Observação: o comando a seguir pressupõe que você tenha feito login na CLI do gcloud com sua conta de usuário executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que faz login automaticamente na CLI gcloud. . Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Observação: o comando a seguir pressupõe que você tenha feito login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login . Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Você receberá uma resposta JSON semelhante a seguinte.

Resposta

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025. The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
          }
        ]
      },
      "finishReason": "STOP",
      "groundingMetadata": {
        "webSearchQueries": [
          "who won the last super bowl"
        ],
        "groundingChunks": [
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX",
              "domain": "domain.com"
            }
          },
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX Results",
              "domain": "domain.com"
            }
          }
        ],
        "groundingSupports": [
          {
            "segment": {
              "endIndex": 77,
              "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025."
            },
            "groundingChunkIndices": [
              0,
              1
            ]
          },
          {
            "segment": {
              "startIndex": 78,
              "endIndex": 198,
              "text": "The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
            },
            "groundingChunkIndices": [
              0
            ]
          },
        ]
      }
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 33,
    "candidatesTokenCount": 106,
    "totalTokenCount": 284,
    "billablePromptUsage": {
      "textCount": 142
    },
    "trafficType": "ON_DEMAND",
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 33
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 106
      }
    ],
    "toolUsePromptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 39
      }
    ],
    "toolUsePromptTokenCount": 39,
    "thoughtsTokenCount": 106
  },
  "modelVersion": "MODEL_VERSION",
  "createTime": "CREATE_TIME",
  "responseId": "RESPONSE_ID"
}

Cota

A cota padrão é de 200 comandos por minuto. Se você precisar aumentar seus limites de taxa, entre em contato com support@parallel.ai e com sua equipe de conta do Google com seu caso de uso e requisitos.

Faturamento

O uso do embasamento com a pesquisa paralela gera as seguintes cobranças:

Consumo de tokens do Gemini: tokens de comando, de raciocínio e de saída. Para saber mais informações, consulte Preços.
Fundamentação do Gemini com seus dados: para mais informações, consulte Preços.
- Os tokens de entrada fornecidos pelo Parallel não geram cobranças extras.
Preços para o uso da API de pesquisa do Parallel: para mais informações, consulte a página de preços do Parallel.