Grounding con Parallel Web Search

Parallel Web Systems offre un'API di ricerca che fornisce l'accesso ai dati web disponibili pubblicamente ottimizzati per l'utilizzo da parte di modelli linguistici di grandi dimensioni per il grounding. Questa pagina spiega come basare le risposte di Gemini utilizzando Parallel.

Il grounding con Parallel su Vertex AI è un'offerta separata (come definita nel tuo Google Cloud contratto) che collega i modelli Gemini ai dati web pubblici forniti da Parallel Web Systems' search API. Questo servizio consente a Gemini di accedere a informazioni in tempo reale da miliardi di pagine web per garantire risposte più aggiornate e fattuali.

Tieni presente quanto segue: per utilizzare Parallel Google Cloud deve inviare determinati dati del cliente all' offerta separata di Parallel per l'elaborazione. L'utilizzo del servizio Parallel è regolato dai termini di utilizzo separati di Parallel e dalla norma sull'utilizzo accettabile di Parallel.

Casi d'uso

Il grounding con Parallel è adatto a casi d'uso come i seguenti:

  • Utilizzo dei dati web per scopi di completamento o arricchimento delle informazioni.
  • Agenti multi-hop che richiedono ricerche web più approfondite per domande più complesse.
  • Creazione di un'API che integra i dati di ricerca web.
  • Assistenti rivolti ai dipendenti che consentono agli utenti finali di porre domande e creare report complessi utilizzando le informazioni web più recenti.
  • Applicazioni rivolte ai consumatori, come vendita al dettaglio e viaggi, che consentono all'utente di prendere decisioni di acquisto informate.
  • Agenti automatici che vengono eseguiti autonomamente per eseguire attività automatizzate, come l'analisi delle notizie e i controlli KYC.
  • Agenti verticali (agenti di vendita, agenti di codifica, agenti finanziari) che ottengono il contesto più recente e aggiornato dal web.

Esempio

Chi ha vinto il Gran Premio di Formula 1 di Las Vegas 2025?

Senza grounding Con grounding
Il Gran Premio di Las Vegas 2025 non si è ancora svolto. La gara è in programma per il fine settimana del 20-22 novembre 2025. Pertanto, il vincitore è attualmente sconosciuto. Il vincitore del Gran Premio di Formula 1 di Las Vegas 2025 è stato Max Verstappen della Red Bull Racing. La gara si è svolta il 22 novembre 2025. Origini: domain1.com, domain2.com, ...

Modelli supportati

Il grounding con Parallel Web Search è supportato dai seguenti modelli:

  • Gemini 2.5 Flash (gemini-2.5-flash)
  • Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
  • Gemini 2.5 Pro (gemini-2.5-pro)
  • Gemini 3.1 Pro (gemini-3.1-pro-preview)
  • Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Prima di iniziare

Per utilizzare il grounding con Parallel, devi ottenere una chiave API da Parallel's web site. Questa chiave API viene utilizzata nella richiesta a Gemini.

Basare le risposte di Gemini con Parallel

Richiedi risposte basate da Gemini utilizzando l'API REST come segue. Per prestazioni ottimali, ti consigliamo di utilizzare le impostazioni predefinite per i parametri facoltativi, a meno che non siano strettamente necessari valori non predefiniti.

REST

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

  • LOCATION: la regione in cui elaborare la richiesta. Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su `global`.
  • PROJECT_ID: l' Google Cloud ID progetto.
  • MODEL_ID: l'ID del modello da utilizzare.
  • TEXT: il prompt di testo da inviare al modello.
  • API_KEY: la tua chiave API per Parallel Web Search.
  • EXCLUDE_DOMAINS: (facoltativo) elenco di domini da escludere dalle origini di grounding. Se specificato, le origini di questi domini vengono escluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
  • INCLUDE_DOMAINS: (facoltativo) elenco di domini da includere nelle origini di grounding. Se specificato, le origini di questi domini vengono incluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
  • MAX_CHARS_PER_RESULT: (facoltativo) il numero massimo di caratteri da includere in ogni estratto dei risultati di ricerca. Se non specificato, il valore predefinito è 30000. L'intervallo consentito è [1000, 100000].
  • MAX_CHARS_TOTAL: (facoltativo) il numero massimo totale di caratteri di tutti gli estratti dei risultati di ricerca. Se non specificato, il valore predefinito è 100000. L'intervallo consentito è [1000, 1000000].
  • MAX_RESULTS: (facoltativo) il numero massimo di risultati di ricerca da utilizzare per il grounding. Se non specificato, il valore predefinito è 10. L'intervallo consentito è [1, 20].

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON della richiesta:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Per inviare la richiesta, espandi una di queste opzioni:

Dovresti ricevere una risposta JSON simile alla seguente.

Quota

La quota predefinita è di 200 prompt al minuto. Se devi aumentare i limiti di frequenza, contatta support@parallel.ai e il team dell'account Google con il tuo caso d'uso e i tuoi requisiti.

Fatturazione

L'utilizzo del grounding con Parallel comporta i seguenti addebiti:

  • Consumo di token Gemini: token di prompt, token di ragionamento, token di output. Per ulteriori informazioni, vedi Prezzi.
  • Grounding di Gemini con i tuoi dati: per ulteriori informazioni, vedi Prezzi.
    • I token di input forniti da Parallel non vengono addebitati.
  • Prezzi per l'utilizzo dell'API di ricerca di Parallel: per ulteriori informazioni, consulta la pagina dei prezzi di Parallel.