Esta página foi traduzida pela API Cloud Translation.

Embasamento com pesquisa na Web paralela

O Parallel Web Systems (em inglês) oferece uma API de pesquisa que dá acesso a dados da Web disponíveis publicamente e otimizados para uso por modelos de linguagem grandes para embasamento. Nesta página, explicamos como embasar as respostas do Gemini usando o Parallel.

O embasamento com a Parallel na Vertex AI é uma oferta separada (conforme definido no seu Contrato Google Cloud ) que conecta os modelos do Gemini a dados da Web públicos fornecidos pela API de pesquisa da Parallel Web Systems. Esse serviço dá ao Gemini acesso a informações atualizadas de bilhões de páginas da Web para garantir respostas mais atuais e factuais.

Observação: o uso do Parallel exige que o Google Cloud envie determinados dados do cliente para a Oferta separada do Parallel para processamento. O uso do serviço Parallel é regido pelos Termos de Uso separados da Parallel e pela Política de Uso Aceitável da Parallel.

Casos de uso

O embasamento com Parallel é adequado para casos de uso como os seguintes:

Usar dados da Web para fins de conclusão ou enriquecimento de informações.
Agentes de várias etapas que exigem pesquisas na Web mais detalhadas para perguntas mais complexas.
Criar uma API que integra dados de pesquisa na Web.
Assistentes para funcionários que permitem ao usuário final fazer perguntas e criar relatórios complexos usando as informações mais recentes da Web.
Aplicativos voltados ao consumidor, como varejo e viagens, que permitem ao usuário tomar decisões de compra fundamentadas.
Agentes automatizados que são executados de forma autônoma para realizar tarefas automatizadas, como análise de notícias e verificações de KYC.
Agentes verticais (de vendas, programação, finanças) recebendo o contexto mais recente e atualizado da Web.

Exemplo

Quem ganhou o Grande Prêmio de F1 de Las Vegas de 2025?

Sem embasamento	Com embasamento
O Grande Prêmio de Las Vegas de 2025 ainda não aconteceu. A corrida está programada para acontecer no fim de semana de 20 a 22 de novembro de 2025. Portanto, o vencedor ainda não foi definido.	O vencedor do Grande Prêmio de F1 de Las Vegas de 2025 foi Max Verstappen, da Red Bull Racing. A corrida aconteceu em 22 de novembro de 2025. Fontes:domínio1.com, domínio2.com, ...

Modelos compatíveis

Esta seção lista os modelos que oferecem suporte ao Embasamento com a pesquisa paralela na Web.

Gemini 3 Flash Modelo de pré-lançamento
Gemini 3 Pro Modelo de pré-lançamento
Imagem do Gemini 3 Pro Modelo de pré-lançamento
Gemini 2.5 Pro
Gemini 2.5 Flash Modelo de pré-lançamento
Gemini 2.5 Flash-Lite Modelo de pré-lançamento
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash com áudio nativo da API Gemini Live
Gemini 2.5 Flash com áudio nativo da API Live (pré-lançamento) Modelo de pré-lançamento
Gemini 2.0 Flash com API Live Modelo de pré-lançamento
Gemini 2.0 Flash

Antes de começar

Para usar o embasamento com o Parallel, você precisa receber uma chave de API do site do Parallel. Essa chave de API é usada na sua solicitação ao Gemini.

Fundamentar respostas do Gemini com o Parallel

Solicite respostas embasadas do Gemini usando a API REST da seguinte forma. Para ter o melhor desempenho, recomendamos usar as configurações padrão para parâmetros opcionais, a menos que você precise de valores diferentes.

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

LOCATION: a região para processar a solicitação. Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como "global".
PROJECT_ID: o ID do projeto do Google Cloud .
MODEL_ID: o ID do modelo que será usado.
TEXT: o comando de texto a ser enviado para o modelo.
API_KEY: sua chave de API para a Pesquisa de IA paralela.
EXCLUDE_DOMAINS: opcional. Lista de domínios a serem excluídos das fontes de embasamento. Se especificado, as fontes desses domínios serão excluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto ( .gov, .edu, .co.uk). É possível especificar até 10 domínios.
INCLUDE_DOMAINS (opcional): lista de domínios a serem incluídos nas fontes de embasamento. Se especificado, as fontes desses domínios serão incluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto ( .gov, .edu, .co.uk). É possível especificar até 10 domínios.
MAX_CHARS_PER_RESULT: opcional. O número máximo de caracteres a serem incluídos em cada trecho de resultado da pesquisa. Se não for especificado, o padrão será 30000. O intervalo permitido é [1000, 100000].
MAX_CHARS_TOTAL: opcional. O número máximo total de caracteres de todos os trechos de resultados da pesquisa. Se não for especificado, 100000 será usado como padrão para . O intervalo permitido é [1000, 1000000].
MAX_RESULTS: opcional. O número máximo de resultados da pesquisa a serem usados para embasamento. Se não for especificado, 10 será usado como padrão para . O intervalo permitido é [1, 20].

Método HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON da solicitação:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Para enviar a solicitação, expanda uma destas opções:

curl (Linux, macOS ou Cloud Shell)

Observação: o comando a seguir pressupõe que você tenha feito login na CLI do gcloud com sua conta de usuário executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que faz login automaticamente na CLI gcloud. . Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Observação: o comando a seguir pressupõe que você tenha feito login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login . Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Você receberá uma resposta JSON semelhante a seguinte.

Resposta

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025. The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
          }
        ]
      },
      "finishReason": "STOP",
      "groundingMetadata": {
        "webSearchQueries": [
          "who won the last super bowl"
        ],
        "groundingChunks": [
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX",
              "domain": "domain.com"
            }
          },
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX Results",
              "domain": "domain.com"
            }
          }
        ],
        "groundingSupports": [
          {
            "segment": {
              "endIndex": 77,
              "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025."
            },
            "groundingChunkIndices": [
              0,
              1
            ]
          },
          {
            "segment": {
              "startIndex": 78,
              "endIndex": 198,
              "text": "The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
            },
            "groundingChunkIndices": [
              0
            ]
          },
        ]
      }
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 33,
    "candidatesTokenCount": 106,
    "totalTokenCount": 284,
    "billablePromptUsage": {
      "textCount": 142
    },
    "trafficType": "ON_DEMAND",
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 33
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 106
      }
    ],
    "toolUsePromptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 39
      }
    ],
    "toolUsePromptTokenCount": 39,
    "thoughtsTokenCount": 106
  },
  "modelVersion": "MODEL_VERSION",
  "createTime": "CREATE_TIME",
  "responseId": "RESPONSE_ID"
}

Cota

A cota padrão é de 60 comandos por minuto. Se você precisar aumentar seus limites de taxa, entre em contato com support@parallel.ai e com sua equipe de conta do Google com seu caso de uso e requisitos.

Faturamento

O uso do embasamento com Parallel incorre nas seguintes cobranças:

Consumo de tokens do Gemini: tokens de comando, de raciocínio e de saída. Para saber mais informações, consulte Preços.
Fundamentação do Gemini com seus dados: para mais informações, consulte Preços.
- Os tokens de entrada fornecidos pelo Parallel não geram cobranças extras.
Preços para o uso da API Search do Parallel: para mais informações, consulte a página de preços do Parallel.