Parallel Web Systems propose une API de recherche qui permet d'accéder à des données Web accessibles au public et optimisées pour être utilisées par de grands modèles de langage pour l'ancrage. Cette page explique comment ancrer les réponses de Gemini à l'aide de Parallel.
L'ancrage avec Parallel sur Vertex AI est une offre distincte (telle que définie dans votre contrat Google Cloud ) qui connecte les modèles Gemini aux données Web publiques fournies par l'API Search de Parallel Web Systems. Ce service permet à Gemini d'accéder à des informations en direct provenant de milliards de pages Web pour fournir des réponses plus à jour et factuelles.
Veuillez noter les points suivants : Pour que vous puissiez utiliser Parallel, Google Cloud doit envoyer certaines données client à l'Offre distincte Parallel pour traitement. Votre utilisation du service Parallel est régie par les Conditions d'utilisation distinctes de Parallel et le Règlement sur l'utilisation autorisée de Parallel.
Cas d'utilisation
L'ancrage avec Parallel convient aux cas d'utilisation suivants :
- Utilisation de données Web pour compléter ou enrichir des informations.
- Agents multi-hop qui nécessitent des recherches Web plus approfondies pour les questions plus complexes.
- Créer une API qui intègre des données de recherche sur le Web.
- Assistants destinés aux employés qui permettent à l'utilisateur final de poser des questions et de créer des rapports complexes à l'aide des dernières informations Web.
- Applications destinées aux consommateurs, comme celles de vente au détail et de voyage, qui permettent à l'utilisateur de prendre des décisions d'achat éclairées.
- Agents automatisés qui s'exécutent de manière autonome pour effectuer des tâches automatisées, comme l'analyse de l'actualité et les vérifications KYC.
- Les agents verticaux (agents commerciaux, agents de codage, agents financiers) obtiennent le contexte le plus récent et le plus à jour sur le Web.
Exemple
Qui a remporté le Grand Prix de F1 de Las Vegas en 2025 ?
| Sans ancrage | Avec mise à la terre |
|---|---|
| Le Grand Prix de Las Vegas 2025 n'a pas encore eu lieu. La course est prévue pour le week-end du 20 au 22 novembre 2025. Le gagnant n'est donc pas encore connu. | Le vainqueur du Grand Prix de F1 de Las Vegas 2025 était Max Verstappen de Red Bull Racing. La course a eu lieu le 22 novembre 2025. Sources : domain1.com, domain2.com, ... |
Modèles compatibles
Cette section liste les modèles compatibles avec l'ancrage avec la recherche Web parallèle.
- Gemini 3 Flash Modèle en preview
- Gemini 3 Pro Modèle en preview
- Image Gemini 3 Pro Modèle Preview
- Gemini 2.5 Pro
- Gemini 2.5 Flash Modèle en preview
- Gemini 2.5 Flash-Lite Modèle en prévisualisation
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash avec l'API Gemini Live et l'audio natif
- Gemini 2.5 Flash avec l'audio natif de l'API Live (preview) Modèle preview
- Gemini 2.0 Flash avec l'API Live Modèle en preview
- Gemini 2.0 Flash
Avant de commencer
Pour utiliser l'ancrage avec Parallel, vous devez obtenir une clé API sur le site Web de Parallel. Cette clé API est utilisée dans votre requête à Gemini.
Ancrer les réponses Gemini avec Parallel
Pour demander des réponses ancrées à Gemini à l'aide de l'API REST, procédez comme suit. Pour obtenir les meilleures performances, nous vous recommandons d'utiliser les paramètres par défaut pour les paramètres facultatifs, sauf si vous avez absolument besoin de valeurs non définies par défaut.
REST
Avant d'utiliser des données de requête, effectuez les remplacements suivants :
- LOCATION : région dans laquelle traiter la requête. Pour utiliser le point de terminaison global, excluez l'emplacement du nom du point de terminaison et configurez l'emplacement de la ressource sur "global".
- PROJECT_ID : ID de votre projet Google Cloud .
- MODEL_ID : ID du modèle à utiliser.
- TEXT : prompt textuel à envoyer au modèle.
- API_KEY : votre clé API pour la recherche Parallel AI.
- EXCLUDE_DOMAINS : liste facultative des domaines à exclure des sources d'ancrage. Si cette option est spécifiée, les sources de ces domaines sont exclues. Les valeurs acceptables sont des domaines (www.example.com) ou des extensions de domaine commençant par un point (.gov, .edu, .co.uk). Vous pouvez spécifier jusqu'à 10 domaines.
- INCLUDE_DOMAINS : liste facultative des domaines à inclure dans les sources d'ancrage. Si elles sont spécifiées, les sources de ces domaines sont incluses. Les valeurs acceptables sont des domaines (www.example.com) ou des extensions de domaine commençant par un point (.gov, .edu, .co.uk). Vous pouvez spécifier jusqu'à 10 domaines.
- MAX_CHARS_PER_RESULT (facultatif) : nombre maximal de caractères à inclure dans l'extrait de chaque résultat de recherche. Si aucune valeur n'est spécifiée, la valeur par défaut est
30000. La plage autorisée est[1000, 100000]. - MAX_CHARS_TOTAL (facultatif) : nombre maximal de caractères de tous les extraits de résultats de recherche. Si aucune valeur n'est spécifiée, la valeur par défaut est
100000. La plage autorisée est[1000, 1000000]. - MAX_RESULTS (facultatif) : nombre maximal de résultats de recherche à utiliser pour l'ancrage. Si aucune valeur n'est spécifiée, la valeur par défaut est
10. La plage autorisée est[1, 20].
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Corps JSON de la requête :
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Pour envoyer votre requête, développez l'une des options suivantes :
Vous devriez recevoir une réponse JSON semblable à la suivante.
Quota
Le quota par défaut est de 60 requêtes par minute. Si vous devez augmenter vos limites de fréquence, contactez support@parallel.ai et votre équipe de compte Google en précisant votre cas d'utilisation et vos exigences.
Facturation
L'utilisation de l'ancrage avec Parallel entraîne les frais suivants :
- Consommation de jetons Gemini : jetons de requête, jetons de réflexion, jetons de sortie. Pour en savoir plus, reportez-vous à la page Tarifs.
- Ancrage de Gemini sur vos données : pour en savoir plus, consultez la page Tarifs.
- Les jetons d'entrée fournis par Parallel ne sont pas facturés en supplément.
- Tarifs de l'API de recherche de Parallel : pour en savoir plus, consultez la page des tarifs de Parallel.