Embasamento com pesquisa na Web paralela

O Parallel Web Systems (em inglês) oferece uma API de pesquisa que dá acesso a dados da Web disponíveis publicamente e otimizados para uso por modelos de linguagem grandes para embasamento. Nesta página, explicamos como embasar as respostas do Gemini usando o Parallel.

O embasamento com a Parallel na Vertex AI é uma oferta separada (conforme definido no seu Contrato Google Cloud ) que conecta os modelos do Gemini a dados da Web públicos fornecidos pela API de pesquisa da Parallel Web Systems. Esse serviço dá ao Gemini acesso a informações atualizadas de bilhões de páginas da Web para garantir respostas mais atuais e factuais.

Observação: o uso do Parallel exige que o Google Cloud envie determinados dados do cliente para a Oferta separada do Parallel para processamento. O uso do serviço Parallel é regido pelos Termos de Uso separados da Parallel e pela Política de Uso Aceitável da Parallel.

Casos de uso

O embasamento com Parallel é adequado para casos de uso como os seguintes:

  • Usar dados da Web para fins de conclusão ou enriquecimento de informações.
  • Agentes de várias etapas que exigem pesquisas na Web mais detalhadas para perguntas mais complexas.
  • Criar uma API que integra dados de pesquisa na Web.
  • Assistentes para funcionários que permitem ao usuário final fazer perguntas e criar relatórios complexos usando as informações mais recentes da Web.
  • Aplicativos voltados ao consumidor, como varejo e viagens, que permitem ao usuário tomar decisões de compra fundamentadas.
  • Agentes automatizados que são executados de forma autônoma para realizar tarefas automatizadas, como análise de notícias e verificações de KYC.
  • Agentes verticais (de vendas, programação, finanças) recebendo o contexto mais recente e atualizado da Web.

Exemplo

Quem ganhou o Grande Prêmio de F1 de Las Vegas de 2025?

Sem embasamento Com embasamento
O Grande Prêmio de Las Vegas de 2025 ainda não aconteceu. A corrida está programada para acontecer no fim de semana de 20 a 22 de novembro de 2025. Portanto, o vencedor ainda não foi definido. O vencedor do Grande Prêmio de F1 de Las Vegas de 2025 foi Max Verstappen, da Red Bull Racing. A corrida aconteceu em 22 de novembro de 2025. Fontes:domínio1.com, domínio2.com, ...

Modelos compatíveis

Esta seção lista os modelos que oferecem suporte ao Embasamento com a pesquisa paralela na Web.

Antes de começar

Para usar o embasamento com o Parallel, você precisa receber uma chave de API do site do Parallel. Essa chave de API é usada na sua solicitação ao Gemini.

Fundamentar respostas do Gemini com o Parallel

Solicite respostas embasadas do Gemini usando a API REST da seguinte forma. Para ter o melhor desempenho, recomendamos usar as configurações padrão para parâmetros opcionais, a menos que você precise de valores diferentes.

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

  • LOCATION: a região para processar a solicitação. Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como "global".
  • PROJECT_ID: o ID do projeto do Google Cloud .
  • MODEL_ID: o ID do modelo que será usado.
  • TEXT: o comando de texto a ser enviado para o modelo.
  • API_KEY: sua chave de API para a Pesquisa de IA paralela.
  • EXCLUDE_DOMAINS: opcional. Lista de domínios a serem excluídos das fontes de embasamento. Se especificado, as fontes desses domínios serão excluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto ( .gov, .edu, .co.uk). É possível especificar até 10 domínios.
  • INCLUDE_DOMAINS (opcional): lista de domínios a serem incluídos nas fontes de embasamento. Se especificado, as fontes desses domínios serão incluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto ( .gov, .edu, .co.uk). É possível especificar até 10 domínios.
  • MAX_CHARS_PER_RESULT: opcional. O número máximo de caracteres a serem incluídos em cada trecho de resultado da pesquisa. Se não for especificado, o padrão será 30000. O intervalo permitido é [1000, 100000].
  • MAX_CHARS_TOTAL: opcional. O número máximo total de caracteres de todos os trechos de resultados da pesquisa. Se não for especificado, 100000 será usado como padrão para . O intervalo permitido é [1000, 1000000].
  • MAX_RESULTS: opcional. O número máximo de resultados da pesquisa a serem usados para embasamento. Se não for especificado, 10 será usado como padrão para . O intervalo permitido é [1, 20].

Método HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON da solicitação:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Para enviar a solicitação, expanda uma destas opções:

Você receberá uma resposta JSON semelhante a seguinte.

Cota

A cota padrão é de 60 comandos por minuto. Se você precisar aumentar seus limites de taxa, entre em contato com support@parallel.ai e com sua equipe de conta do Google com seu caso de uso e requisitos.

Faturamento

O uso do embasamento com Parallel incorre nas seguintes cobranças:

  • Consumo de tokens do Gemini: tokens de comando, de raciocínio e de saída. Para saber mais informações, consulte Preços.
  • Fundamentação do Gemini com seus dados: para mais informações, consulte Preços.
    • Os tokens de entrada fornecidos pelo Parallel não geram cobranças extras.
  • Preços para o uso da API Search do Parallel: para mais informações, consulte a página de preços do Parallel.