Ancrage avec la recherche Web parallèle

Parallel Web Systems propose une API de recherche qui donne accès à des données Web accessibles au public et optimisées pour être utilisées par des modèles de langage volumineux à des fins d'ancrage. Cette page explique comment ancrer les réponses Gemini à l'aide de Parallel.

L'ancrage avec Parallel sur Gemini Enterprise Agent Platform est une offre distincte (telle que définie dans votre Google Cloud contrat) qui connecte les modèles Gemini aux données Web publiques fournies par l'API de recherche de Parallel Web Systems'. Ce service permet à Gemini d'accéder à des informations en direct provenant de milliards de pages Web pour garantir des réponses plus à jour et factuelles.

Remarque : Pour que vous puissiez utiliser Parallel vous devez autoriser Google Cloud à envoyer certaines données client à l' offre distincte Parallel pour traitement. Votre utilisation du service Parallel est régie par les conditions d'utilisation distinctes de Parallel et par la politique d'utilisation acceptable de Parallel.

Cas d'utilisation

L'ancrage avec Parallel est adapté aux cas d'utilisation suivants, par exemple :

  • Utilisation de données Web à des fins de complément ou d'enrichissement d'informations.
  • Agents multi-sauts qui nécessitent des recherches Web plus approfondies pour des questions plus complexes.
  • Création d'une API qui intègre des données de recherche Web.
  • Assistants destinés aux employés qui permettent aux utilisateurs finaux de poser des questions et de créer des rapports complexes à l'aide des dernières informations Web.
  • Applications en contact avec les clients, comme les applications de vente au détail et de voyage, qui permettent à l'utilisateur de prendre des décisions d'achat éclairées.
  • Agents automatisés qui s'exécutent de manière autonome pour effectuer des tâches automatisées, comme l'analyse de l'actualité et les vérifications KYC.
  • Agents verticaux (agents commerciaux, agents de codage, agents financiers) qui obtiennent le contexte le plus récent sur le Web.

Exemple

Qui a remporté le Grand Prix de Formule 1 de Las Vegas 2025 ?

Sans ancrage Avec ancrage
Le Grand Prix de Las Vegas 2025 n'a pas encore eu lieu. La course est prévue le week-end du 20 au 22 novembre 2025. Le vainqueur est donc inconnu. Le vainqueur du Grand Prix de Formule 1 de Las Vegas 2025 est Max Verstappen de Red Bull Racing. La course a eu lieu le 22 novembre 2025. Sources : domaine1.com, domaine2.com, ...

Modèles compatibles

L'ancrage avec la recherche Web parallèle est compatible avec les modèles suivants :

  • Gemini 2.5 Flash (gemini-2.5-flash)
  • Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
  • Gemini 2.5 Pro (gemini-2.5-pro)
  • Gemini 3.1 Pro (gemini-3.1-pro-preview)
  • Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Avant de commencer

Pour utiliser l'ancrage avec Parallel, vous devez obtenir une clé API sur le site Web de Parallel. Cette clé API est utilisée dans votre requête adressée à Gemini.

Ancrer les réponses Gemini avec Parallel

Demandez des réponses ancrées à Gemini à l'aide de l'API REST comme suit. Pour obtenir des performances optimales, nous vous recommandons d'utiliser les paramètres par défaut pour les paramètres facultatifs, sauf si vous avez absolument besoin de valeurs non par défaut.

REST

Avant d'utiliser les données de requête, effectuez les remplacements suivants :

  • LOCATION : région dans laquelle traiter la requête. Pour utiliser le point de terminaison global, excluez l'emplacement du nom du point de terminaison et configurez l'emplacement de la ressource sur `global`.
  • PROJECT_ID : ID de votre Google Cloud projet.
  • MODEL_ID : ID du modèle à utiliser.
  • TEXT : prompt textuelle à envoyer au modèle.
  • API_KEY : votre clé API pour Parallel AI Search.
  • EXCLUDE_DOMAINS : facultatif : liste des domaines à exclure des sources d'ancrage. Si cette option est spécifiée, les sources de ces domaines sont exclues. Les valeurs acceptables sont les domaines (www.example.com) ou les extensions de domaine commençant par un point ( .gov, .edu, .co.uk). Vous pouvez spécifier jusqu'à 10 domaines.
  • INCLUDE_DOMAINS : facultatif : liste des domaines à inclure dans les sources d'ancrage. Si cette option est spécifiée, les sources de ces domaines sont incluses. Les valeurs acceptables sont les domaines (www.example.com) ou les extensions de domaine commençant par un point ( .gov, .edu, .co.uk). Vous pouvez spécifier jusqu'à 10 domaines.
  • MAX_CHARS_PER_RESULT : facultatif : nombre maximal de caractères à inclure dans chaque extrait de résultat de recherche. Si aucune valeur n'est spécifiée, la valeur par défaut est à 30000. La plage autorisée est [1000, 100000].
  • MAX_CHARS_TOTAL : facultatif : nombre total maximal de caractères de tous les extraits de résultats de recherche. Si aucune valeur n'est spécifiée, la valeur par défaut est 100000. La plage autorisée est [1000, 1000000].
  • MAX_RESULTS : facultatif : nombre maximal de résultats de recherche à utiliser pour l'ancrage. Si aucune valeur n'est spécifiée, la valeur par défaut est 10. La plage autorisée est [1, 20].
  • MODE : facultatif : mode à utiliser pour la requête, one-shot ou fast. La valeur par défaut est one-shot. Envisagez le mode fast si vous souhaitez optimiser la latence.
  • SEARCH_LOCATION : facultatif : code pays ISO 3166-1 alpha-2 pour les résultats de recherche géociblés. Exemple : "us".

Méthode HTTP et URL :

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corps JSON de la requête :

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "mode": "MODE",
            "location": "SEARCH_LOCATION",
            "max_results": MAX_RESULTS,
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            }
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Pour envoyer votre requête, développez l'une des options suivantes :

Vous devriez recevoir une réponse JSON semblable à la suivante.

Quota

Le quota par défaut est de 200 prompts par minute. Si vous devez augmenter vos limites de débit, contactez support@parallel.ai et votre équipe de compte Google en indiquant votre cas d'utilisation et vos exigences.

Facturation

L'utilisation de l'ancrage avec Parallel entraîne les frais suivants :

  • Consommation de jetons Gemini : jetons de prompt, jetons de raisonnement, jetons de sortie. Pour en savoir plus, reportez-vous à la page Tarifs.
  • Ancrage de Gemini avec vos données : pour en savoir plus, consultez la page Tarifs.
    • Les jetons d'entrée fournis par Parallel ne sont pas facturés en supplément.
  • Tarifs d'utilisation de l'API de recherche de Parallel : pour en savoir plus, consultez la page Tarifs de Parallel.