Il grounding con Parallel su Vertex AI è un'offerta separata (come definita nel tuo Google Cloud contratto) che collega i modelli Gemini ai dati web pubblici forniti da Parallel Web Systems' search API. Questo servizio consente a Gemini di accedere a informazioni in tempo reale da miliardi di pagine web per garantire risposte più aggiornate e fattuali.
Tieni presente quanto segue: per utilizzare Parallel Google Cloud deve inviare determinati dati del cliente all' offerta separata di Parallel per l'elaborazione. L'utilizzo del servizio Parallel è regolato dai termini di utilizzo separati di Parallel e dalla norma sull'utilizzo accettabile di Parallel.
Casi d'uso
Il grounding con Parallel è adatto a casi d'uso come i seguenti:
- Utilizzo dei dati web per scopi di completamento o arricchimento delle informazioni.
- Agenti multi-hop che richiedono ricerche web più approfondite per domande più complesse.
- Creazione di un'API che integra i dati di ricerca web.
- Assistenti rivolti ai dipendenti che consentono agli utenti finali di porre domande e creare report complessi utilizzando le informazioni web più recenti.
- Applicazioni rivolte ai consumatori, come vendita al dettaglio e viaggi, che consentono all'utente di prendere decisioni di acquisto informate.
- Agenti automatici che vengono eseguiti autonomamente per eseguire attività automatizzate, come l'analisi delle notizie e i controlli KYC.
- Agenti verticali (agenti di vendita, agenti di codifica, agenti finanziari) che ottengono il contesto più recente e aggiornato dal web.
Esempio
Chi ha vinto il Gran Premio di Formula 1 di Las Vegas 2025?
| Senza grounding | Con grounding |
|---|---|
| Il Gran Premio di Las Vegas 2025 non si è ancora svolto. La gara è in programma per il fine settimana del 20-22 novembre 2025. Pertanto, il vincitore è attualmente sconosciuto. | Il vincitore del Gran Premio di Formula 1 di Las Vegas 2025 è stato Max Verstappen della Red Bull Racing. La gara si è svolta il 22 novembre 2025. Origini: domain1.com, domain2.com, ... |
Modelli supportati
Il grounding con Parallel Web Search è supportato dai seguenti modelli:
- Gemini 2.5 Flash (
gemini-2.5-flash) - Gemini 2.5 Flash-Lite (
gemini-2.5-flash-lite) - Gemini 2.5 Pro (
gemini-2.5-pro) - Gemini 3.1 Pro (
gemini-3.1-pro-preview) - Gemini 3 Flash Lite (
gemini-3-flash-lite-preview)
Prima di iniziare
Per utilizzare il grounding con Parallel, devi ottenere una chiave API da Parallel's web site. Questa chiave API viene utilizzata nella richiesta a Gemini.
Basare le risposte di Gemini con Parallel
Richiedi risposte basate da Gemini utilizzando l'API REST come segue. Per prestazioni ottimali, ti consigliamo di utilizzare le impostazioni predefinite per i parametri facoltativi, a meno che non siano strettamente necessari valori non predefiniti.
REST
Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- LOCATION: la regione in cui elaborare la richiesta. Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su `global`.
- PROJECT_ID: l' Google Cloud ID progetto.
- MODEL_ID: l'ID del modello da utilizzare.
- TEXT: il prompt di testo da inviare al modello.
- API_KEY: la tua chiave API per Parallel Web Search.
- EXCLUDE_DOMAINS: (facoltativo) elenco di domini da escludere dalle origini di grounding. Se specificato, le origini di questi domini vengono escluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
- INCLUDE_DOMAINS: (facoltativo) elenco di domini da includere nelle origini di grounding. Se specificato, le origini di questi domini vengono incluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
- MAX_CHARS_PER_RESULT: (facoltativo) il
numero massimo di caratteri da includere in ogni estratto dei risultati di ricerca. Se non specificato, il valore predefinito
è
30000. L'intervallo consentito è[1000, 100000]. - MAX_CHARS_TOTAL: (facoltativo) il numero massimo totale
di caratteri di tutti gli estratti dei risultati di ricerca. Se non specificato, il valore predefinito è
100000. L'intervallo consentito è[1000, 1000000]. - MAX_RESULTS: (facoltativo) il numero massimo di risultati di ricerca
da utilizzare per il grounding. Se non specificato, il valore predefinito è
10. L'intervallo consentito è[1, 20].
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Corpo JSON della richiesta:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente.
Quota
La quota predefinita è di 200 prompt al minuto. Se devi aumentare i limiti di frequenza, contatta support@parallel.ai e il team dell'account Google con il tuo caso d'uso e i tuoi requisiti.
Fatturazione
L'utilizzo del grounding con Parallel comporta i seguenti addebiti:
- Consumo di token Gemini: token di prompt, token di ragionamento, token di output. Per ulteriori informazioni, vedi Prezzi.
- Grounding di Gemini con i tuoi dati: per ulteriori informazioni, vedi Prezzi.
- I token di input forniti da Parallel non vengono addebitati.
- Prezzi per l'utilizzo dell'API di ricerca di Parallel: per ulteriori informazioni, consulta la pagina dei prezzi di Parallel.