Parallel Web Systems offre un'API di ricerca che fornisce l'accesso a dati web disponibili pubblicamente e ottimizzati per l'utilizzo da parte di modelli linguistici di grandi dimensioni per il grounding. Questa pagina spiega come basare le risposte di Gemini utilizzando Parallel.
Grounding with Parallel su Vertex AI è un'offerta separata (come definita nel tuo Google Cloud Contratto) che collega i modelli Gemini ai dati web pubblici forniti dall'API di ricerca di Parallel Web Systems. Questo servizio consente a Gemini di accedere a informazioni in tempo reale da miliardi di pagine web per garantire risposte più aggiornate e oggettive.
Tieni presente quanto segue: l'utilizzo di Parallel richiede che Google Cloud invii determinati dati dei clienti all'offerta separata Parallel per l'elaborazione. L'utilizzo del servizio Parallel è regolato dai termini di utilizzo separati di Parallel e dalle norme di utilizzo accettabile di Parallel.
Casi d'uso
La fondatezza con Parallel è adatta a casi d'uso come i seguenti:
- Utilizzo dei dati web per il completamento o l'arricchimento delle informazioni.
- Agenti multihop che richiedono ricerche web più approfondite per domande più complesse.
- Creazione di un'API che integra i dati della ricerca web.
- Assistenti rivolti ai dipendenti che consentono all'utente finale di porre domande e creare report complessi utilizzando le informazioni web più recenti.
- Applicazioni rivolte ai consumatori, come quelle per la vendita al dettaglio e i viaggi, che consentono all'utente di prendere decisioni di acquisto informate.
- Agenti automatizzati che vengono eseguiti autonomamente per svolgere attività automatizzate, come l'analisi delle notizie e i controlli KYC.
- Agenti verticali (agenti di vendita, agenti di programmazione, agenti finanziari) che ricevono il contesto più recente e aggiornato dal web.
Esempio
Chi ha vinto il Gran Premio di F1 di Las Vegas del 2025?
| Senza grounding | Con messa a terra |
|---|---|
| Il Gran Premio di Las Vegas 2025 non si è ancora svolto. La gara è prevista per il fine settimana del 20-22 novembre 2025. Pertanto, il vincitore è attualmente sconosciuto. | Il vincitore del Gran Premio di F1 di Las Vegas 2025 è stato Max Verstappen di Red Bull Racing. La gara si è svolta il 22 novembre 2025. Fonti: domain1.com, domain2.com, ... |
Modelli supportati
Questa sezione elenca i modelli che supportano il grounding con la ricerca web parallela.
- Gemini 3 Flash Modello di anteprima
- Gemini 3 Pro Modello di anteprima
- Gemini 3 Pro Image Modello di anteprima
- Gemini 2.5 Pro
- Gemini 2.5 Flash Modello di anteprima
- Gemini 2.5 Flash-Lite Modello di anteprima
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash con audio nativo dell'API Gemini Live
- Gemini 2.5 Flash con audio nativo dell'API Live (anteprima) Modello di anteprima
- Gemini 2.0 Flash con API Live Modello di anteprima
- Gemini 2.0 Flash
Prima di iniziare
Per utilizzare Grounding with Parallel, devi ottenere una chiave API dal sito web di Parallel. Questa chiave API viene utilizzata nella tua richiesta a Gemini.
Grounding delle risposte di Gemini con Parallel
Richiedi risposte basate su dati reali a Gemini utilizzando l'API REST come segue. Per ottenere prestazioni ottimali, ti consigliamo di utilizzare le impostazioni predefinite per i parametri facoltativi, a meno che tu non abbia strettamente bisogno di valori non predefiniti.
REST
Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- LOCATION: La regione in cui elaborare la richiesta. Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su "global".
- PROJECT_ID: l'ID progetto Google Cloud .
- MODEL_ID: l'ID del modello da utilizzare.
- TEXT: il prompt di testo da inviare al modello.
- API_KEY: la tua chiave API per la ricerca parallela con l'AI.
- EXCLUDE_DOMAINS: (Facoltativo) Elenco dei domini da escludere dalle fonti di base. Se specificate, le origini di questi domini vengono escluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
- INCLUDE_DOMAINS: (facoltativo) elenco di domini da includere nelle fonti di base. Se specificate, le fonti di questi domini vengono incluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
- MAX_CHARS_PER_RESULT: facoltativo: il numero massimo di caratteri da includere in ogni estratto dei risultati di ricerca. Se non specificato, il valore predefinito
è
30000. L'intervallo consentito è[1000, 100000]. - MAX_CHARS_TOTAL: facoltativo: il numero massimo totale
di caratteri di tutti gli estratti dei risultati di ricerca. Se non specificato, il valore predefinito è
100000. L'intervallo consentito è[1000, 1000000]. - MAX_RESULTS: (facoltativo) Il numero massimo di risultati di ricerca da utilizzare per la base. Se non specificato, il valore predefinito è
10. L'intervallo consentito è[1, 20].
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Corpo JSON della richiesta:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente.
Quota
La quota predefinita è di 60 prompt al minuto. Se devi aumentare i limiti di frequenza, contatta support@parallel.ai e il tuo team dell'account Google con il tuo caso d'uso e i tuoi requisiti.
Fatturazione
L'utilizzo di Grounding con Parallel comporta i seguenti addebiti:
- Utilizzo dei token di Gemini: token del prompt, token di ragionamento, token di output. Per ulteriori informazioni, vedi Prezzi.
- Grounding di Gemini con i tuoi dati: per ulteriori informazioni, consulta la sezione Prezzi.
- I token di input forniti da Parallel non vengono addebitati a un costo aggiuntivo.
- Prezzi per l'utilizzo dell'API di ricerca di Parallel: per ulteriori informazioni, consulta la pagina dei prezzi di Parallel.