Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Grounding con la ricerca web Parallel

Parallel Web Systems offre un'API di ricerca che fornisce l'accesso a dati web disponibili pubblicamente e ottimizzati per l'utilizzo da parte di modelli linguistici di grandi dimensioni per il grounding. Questa pagina spiega come basare le risposte di Gemini utilizzando Parallel.

Grounding with Parallel su Gemini Enterprise Agent Platform è un'offerta separata (come definita nel tuo Google Cloud Contratto) che connette i modelli Gemini ai dati del web pubblico forniti dall'API di ricerca di Parallel Web Systems. Questo servizio consente a Gemini di accedere a informazioni in tempo reale da miliardi di pagine web per garantire risposte più aggiornate e basate sui fatti.

Tieni presente quanto segue: l'utilizzo di Parallel richiede che Google Cloud invii determinati dati dei clienti all'offerta separata Parallel per il trattamento. L'utilizzo del servizio Parallel è regolato dai termini di utilizzo separati di Parallel e dalle norme di utilizzo accettabile di Parallel.

Casi d'uso

Grounding con Parallel è adatto a casi d'uso come i seguenti:

Utilizzo dei dati web per il completamento o l'arricchimento delle informazioni.
Agenti multihop che richiedono ricerche web più approfondite per domande più complesse.
Creazione di un'API che integra i dati della ricerca web.
Assistenti rivolti ai dipendenti che consentono agli utenti finali di porre domande e creare report complessi utilizzando le informazioni web più recenti.
Applicazioni rivolte ai consumatori, come quelle di vendita al dettaglio e viaggi, che consentono all'utente di prendere decisioni di acquisto informate.
Agenti automatizzati che vengono eseguiti autonomamente per svolgere attività automatizzate, come l'analisi delle notizie e i controlli KYC.
Gli agenti verticali (agenti di vendita, agenti di programmazione, agenti finanziari) ricevono il contesto più recente e aggiornato dal web.

Esempio

Chi ha vinto il Gran Premio di F1 di Las Vegas del 2025?

Senza grounding	Con messa a terra
Il Gran Premio di Las Vegas 2025 non si è ancora svolto. La gara è prevista per il fine settimana del 20-22 novembre 2025. Pertanto, il vincitore è sconosciuto.	Il vincitore del Gran Premio di F1 di Las Vegas 2025 è stato Max Verstappen di Red Bull Racing. La gara si è svolta il 22 novembre 2025. Fonti: domain1.com, domain2.com, ...

Modelli supportati

Il grounding con Parallel Web Search è supportato dai seguenti modelli:

Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 3.1 Pro (gemini-3.1-pro-preview)
Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Prima di iniziare

Per utilizzare Grounding with Parallel, devi ottenere una chiave API dal sito web di Parallel. Questa chiave API viene utilizzata nella richiesta a Gemini.

Grounding delle risposte di Gemini con Parallel

Richiedi risposte basate su dati reali da Gemini utilizzando l'API REST come segue. Per ottenere il massimo rendimento, ti consigliamo di utilizzare le impostazioni predefinite per i parametri facoltativi, a meno che tu non abbia bisogno di valori non predefiniti.

REST

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

LOCATION: la regione in cui elaborare la richiesta. Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su "global".
PROJECT_ID: l'ID progetto Google Cloud .
MODEL_ID: l'ID del modello da utilizzare.
TEXT: il prompt di testo da inviare al modello.
API_KEY: la tua chiave API per la Ricerca AI parallela.
EXCLUDE_DOMAINS: (facoltativo) elenco di domini da escludere dalle fonti di base. Se specificate, le fonti di questi domini vengono escluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
INCLUDE_DOMAINS: (facoltativo) elenco di domini da includere nelle fonti di base. Se specificate, le fonti di questi domini vengono incluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
MAX_CHARS_PER_RESULT: facoltativo: il numero massimo di caratteri da includere in ogni estratto dei risultati di ricerca. Se non specificato, il valore predefinito è 30000. L'intervallo consentito è [1000, 100000].
MAX_CHARS_TOTAL: facoltativo: il numero massimo totale di caratteri di tutti gli estratti dei risultati di ricerca. Se non specificato, il valore predefinito è 100000. L'intervallo consentito è [1000, 1000000].
MAX_RESULTS: (facoltativo) Il numero massimo di risultati di ricerca da utilizzare per la base. Se non specificato, il valore predefinito è 10. L'intervallo consentito è [1, 20].
MODE: (facoltativo) modalità da utilizzare per la richiesta, one-shot o fast. Il valore predefinito è one-shot. Se vuoi ottimizzare la latenza, valuta la modalità fast.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON della richiesta:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS,
            "mode": "MODE"
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Per inviare la richiesta, espandi una di queste opzioni:

curl (Linux, macOS o Cloud Shell)

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Dovresti ricevere una risposta JSON simile alla seguente.

Risposta

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025. The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
          }
        ]
      },
      "finishReason": "STOP",
      "groundingMetadata": {
        "webSearchQueries": [
          "who won the last super bowl"
        ],
        "groundingChunks": [
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX",
              "domain": "domain.com"
            }
          },
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX Results",
              "domain": "domain.com"
            }
          }
        ],
        "groundingSupports": [
          {
            "segment": {
              "endIndex": 77,
              "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025."
            },
            "groundingChunkIndices": [
              0,
              1
            ]
          },
          {
            "segment": {
              "startIndex": 78,
              "endIndex": 198,
              "text": "The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
            },
            "groundingChunkIndices": [
              0
            ]
          },
        ]
      }
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 33,
    "candidatesTokenCount": 106,
    "totalTokenCount": 284,
    "billablePromptUsage": {
      "textCount": 142
    },
    "trafficType": "ON_DEMAND",
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 33
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 106
      }
    ],
    "toolUsePromptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 39
      }
    ],
    "toolUsePromptTokenCount": 39,
    "thoughtsTokenCount": 106
  },
  "modelVersion": "MODEL_VERSION",
  "createTime": "CREATE_TIME",
  "responseId": "RESPONSE_ID"
}

Quota

La quota predefinita è di 200 prompt al minuto. Se devi aumentare i limiti di frequenza, contatta support@parallel.ai e il tuo team dell'account Google con il tuo caso d'uso e i tuoi requisiti.

Fatturazione

L'utilizzo di Grounding con Parallel comporta i seguenti addebiti:

Utilizzo dei token di Gemini: token del prompt, token di ragionamento, token di output. Per ulteriori informazioni, consulta la sezione Prezzi.
Grounding di Gemini con i tuoi dati: per ulteriori informazioni, consulta la sezione Prezzi.
- I token di input forniti da Parallel non vengono addebitati.
Prezzi per l'utilizzo dell'API di ricerca di Parallel: per ulteriori informazioni, consulta la pagina dei prezzi di Parallel.