Fundamentación con la búsqueda web paralela

Parallel Web Systems ofrece una API de búsqueda que proporciona acceso a datos web disponibles públicamente y optimizados para el uso de modelos de lenguaje grandes para la fundamentación. En esta página, se explica cómo fundamentar las respuestas de Gemini con Parallel.

La fundamentación con Parallel en Vertex AI es una Oferta Independiente (según se define en tu Google Cloud Acuerdo) que conecta los modelos de Gemini con los datos web públicos proporcionados por la API de búsqueda de Parallel Web Systems. Este servicio le da acceso a Gemini a información en tiempo real de miles de millones de páginas web para garantizar respuestas más actualizadas y fácticas.

Ten en cuenta lo siguiente: Para usar Parallel, Google Cloud debe enviar ciertos Datos del Cliente a la Oferta Independiente de Parallel para su procesamiento. El uso que hagas del servicio de Parallel se rige por las condiciones de uso independientes de Parallel y la política de uso aceptable de Parallel.

Casos de uso

La fundamentación con Parallel es adecuada para casos de uso como los siguientes:

  • Usamos datos web para completar o enriquecer la información.
  • Agentes de múltiples saltos que requieren búsquedas web más profundas para preguntas más complejas
  • Crear una API que integre datos de la búsqueda web
  • Asistentes para empleados que permiten al usuario final hacer preguntas y crear informes complejos con la información web más reciente.
  • Aplicaciones orientadas al consumidor, como las de venta minorista y viajes, que permiten al usuario tomar decisiones de compra fundamentadas
  • Agentes automatizados que se ejecutan de forma autónoma para realizar tareas automatizadas, como análisis de noticias y verificaciones de CAC.
  • Agentes verticales (agentes de ventas, agentes de programación, agentes financieros) que obtienen el contexto más actualizado de la Web

Ejemplo

¿Quién ganó el Gran Premio de F1 de Las Vegas 2025?

Sin fundamentación Con conexión a tierra
El Gran Premio de Las Vegas 2025 aún no se llevó a cabo. La carrera está programada para el fin de semana del 20 al 22 de noviembre de 2025. Por lo tanto, actualmente se desconoce al ganador. El ganador del Gran Premio de F1 de Las Vegas 2025 fue Max Verstappen de Red Bull Racing. La carrera se llevó a cabo el 22 de noviembre de 2025. Fuentes: dominio1.com, dominio2.com, …

Modelos compatibles

En esta sección, se enumeran los modelos que admiten la fundamentación con la Búsqueda web paralela.

Antes de comenzar

Para usar Grounding with Parallel, debes obtener una clave de API del sitio web de Parallel. Esta clave de API se usa en tu solicitud a Gemini.

Fundamenta las respuestas de Gemini con Parallel

Para solicitar respuestas fundamentadas de Gemini, usa la API de REST de la siguiente manera. Para obtener el mejor rendimiento, te recomendamos que utilices la configuración predeterminada para los parámetros opcionales, a menos que necesites estrictamente valores no predeterminados.

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • LOCATION: La región para procesar la solicitud. Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como "global".
  • PROJECT_ID: Es el ID del proyecto de Google Cloud .
  • MODEL_ID: Es el ID del modelo que se usará.
  • TEXT: Es la instrucción de texto que se enviará al modelo.
  • API_KEY: Es tu clave de API para la Búsqueda con IA paralela.
  • EXCLUDE_DOMAINS: Opcional: Lista de dominios que se excluirán de las fuentes de fundamentación. Si se especifica, se excluyen las fuentes de estos dominios. Los valores aceptables son dominios (www.example.com) o extensiones de dominio que comienzan con un punto (.gov, .edu, .co.uk). Puedes especificar hasta 10 dominios.
  • INCLUDE_DOMAINS: Opcional: Es la lista de dominios que se incluirán en las fuentes de fundamentación. Si se especifica, se incluyen las fuentes de estos dominios. Los valores aceptables son dominios (www.example.com) o extensiones de dominio que comienzan con un punto (.gov, .edu, .co.uk). Puedes especificar hasta 10 dominios.
  • MAX_CHARS_PER_RESULT: Opcional: Es la cantidad máxima de caracteres que se incluirán en cada fragmento de resultado de la búsqueda. Si no se especifica, el valor predeterminado es 30000. El rango permitido es [1000, 100000].
  • MAX_CHARS_TOTAL: Opcional: Es la cantidad máxima total de caracteres de todos los fragmentos de los resultados de la búsqueda. Si no se especifica, el valor predeterminado es 100000. El rango permitido es [1000, 1000000].
  • MAX_RESULTS: Opcional: Es la cantidad máxima de resultados de la búsqueda que se usarán para la fundamentación. Si no se especifica, el valor predeterminado es 10. El rango permitido es [1, 20].

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Cuerpo JSON de la solicitud:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Para enviar tu solicitud, expande una de estas opciones:

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

Cuota

La cuota predeterminada es de 60 instrucciones por minuto. Si necesitas aumentar los límites de frecuencia, comunícate con support@parallel.ai y con tu equipo de cuentas de Google para explicar tu caso de uso y tus requisitos.

Facturación

El uso de Grounding with Parallel genera los siguientes cargos:

  • Consumo de tokens de Gemini: Tokens de instrucciones, tokens de pensamiento y tokens de salida. Para obtener más información, consulta Precios.
  • Fundamentación de Gemini con tus datos: Para obtener más información, consulta Precios.
    • Los tokens de entrada que proporciona Parallel no tienen cargos adicionales.
  • Precios por el uso de la API de búsqueda de Parallel: Para obtener más información, consulta la página de precios de Parallel.