O embasamento com a Parallel na Vertex AI é uma oferta separada (conforme definido no seu Google Cloud contrato) que conecta modelos do Gemini a dados públicos da Web fornecidos pela API de pesquisa da Parallel Web Systems. Esse serviço dá ao Gemini acesso a informações em tempo real de bilhões de páginas da Web para garantir respostas mais atualizadas e factuais.
Observação: o uso da Parallel exige que o Google Cloud envie determinados dados do cliente para a Parallel oferta separada para processamento. O uso do serviço da Parallel é regido pelos termos de uso separados da Parallel e pela política de uso aceitável da Parallel.
Casos de uso
O embasamento com a Parallel é adequado para casos de uso como os seguintes:
- Usar dados da Web para fins de conclusão ou enriquecimento de informações.
- Agentes de várias etapas que exigem pesquisas na Web mais profundas para perguntas mais complexas.
- Criar uma API que integre dados de pesquisa na Web.
- Assistentes para funcionários que permitem que os usuários finais façam perguntas e criem relatórios complexos usando as informações mais recentes da Web.
- Aplicativos voltados ao consumidor, como varejo e viagens, que permitem que o usuário tome decisões de compra informadas.
- Agentes automatizados que são executados de forma autônoma para realizar tarefas automatizadas, como análise de notícias e verificações de KYC.
- Agentes verticais (agentes de vendas, agentes de programação, agentes financeiros) que recebem o contexto mais atualizado da Web.
Exemplo
Quem venceu o Grande Prêmio de F1 de Las Vegas de 2025?
| Sem embasamento | Com embasamento |
|---|---|
| O Grande Prêmio de Las Vegas de 2025 ainda não aconteceu. A corrida está programada para acontecer no fim de semana de 20 a 22 de novembro de 2025. Portanto, o vencedor é desconhecido no momento. | O vencedor do Grande Prêmio de F1 de Las Vegas de 2025 foi Max Verstappen, da Red Bull Racing. A corrida aconteceu em 22 de novembro de 2025. Fontes:domain1.com, domain2.com, ... |
Modelos compatíveis
O embasamento com a Pesquisa Google Paralela na Web é compatível com os seguintes modelos:
- Gemini 2.5 Flash (
gemini-2.5-flash) - Gemini 2.5 Flash-Lite (
gemini-2.5-flash-lite) - Gemini 2.5 Pro (
gemini-2.5-pro) - Gemini 3.1 Pro (
gemini-3.1-pro-preview) - Gemini 3 Flash Lite (
gemini-3-flash-lite-preview)
Antes de começar
Para usar o embasamento com a Parallel, você precisa receber uma chave de API do site da Parallel. Essa chave de API é usada na sua solicitação ao Gemini.
Embasar respostas do Gemini com a Parallel
Solicite respostas embasadas do Gemini usando a API REST da seguinte maneira. Para melhor desempenho, recomendamos o uso das configurações padrão para parâmetros opcionais, a menos que você precise de valores não padrão.
REST
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- LOCATION: a região para processar a solicitação. Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como `global`.
- PROJECT_ID: o ID do Google Cloud projeto do.
- MODEL_ID: o ID do modelo que será usado.
- TEXT: o comando de texto a ser enviado para o modelo.
- API_KEY: sua chave de API para a Pesquisa Google Paralela na Web.
- EXCLUDE_DOMAINS: opcional: lista de domínios a serem excluídos das fontes de embasamento. Se especificado, as fontes desses domínios serão excluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto ( .gov, .edu, .co.uk). É possível especificar até 10 domínios.
- INCLUDE_DOMAINS: opcional: lista de domínios a serem incluídos nas fontes de embasamento. Se especificado, as fontes desses domínios serão incluídas. Os valores aceitáveis são domínios (www.example.com) ou extensões de domínio que começam com um ponto ( .gov, .edu, .co.uk). É possível especificar até 10 domínios.
- MAX_CHARS_PER_RESULT: opcional: o
número máximo de caracteres a serem incluídos em cada trecho de resultado da pesquisa. Se não for especificado, será usado como padrão
para
30000. O intervalo permitido é[1000, 100000]. - MAX_CHARS_TOTAL: opcional: o número máximo total
caracteres de todos os trechos de resultados da pesquisa. Se não for especificado, será usado como padrão para
100000. O intervalo permitido é[1000, 1000000]. - MAX_RESULTS: opcional: o número máximo de resultados da pesquisa a serem usados para embasamento. Se não for especificado, será usado como padrão para
10. O intervalo permitido é[1, 20].
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Corpo JSON da solicitação:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Para enviar a solicitação, expanda uma destas opções:
Você receberá uma resposta JSON semelhante a seguinte.
Quota
A cota padrão é de 200 comandos por minuto. Se você precisar aumentar os limites de taxa, entre em contato support@parallel.ai e com sua equipe de conta do Google com seu caso de uso e requisitos.
Faturamento
O uso do embasamento com a Parallel gera as seguintes cobranças:
- Consumo de tokens do Gemini: tokens de comando, tokens de raciocínio, tokens de saída. Para saber mais informações, consulte Preços.
- Embasamento do Gemini com seus dados: para mais informações, consulte Preços.
- Os tokens de entrada fornecidos pela Parallel não são cobrados extra.
- Preços para o uso da API de pesquisa da Parallel: para mais informações, consulte a página de preços da Parallel.