Questa pagina è stata tradotta dall'API Cloud Translation.

Grounding con la ricerca web parallela

Parallel Web Systems offre un'API di ricerca che fornisce l'accesso a dati web disponibili pubblicamente e ottimizzati per l'utilizzo da parte di modelli linguistici di grandi dimensioni per il grounding. Questa pagina spiega come basare le risposte di Gemini utilizzando Parallel.

Grounding with Parallel su Vertex AI è un'offerta separata (come definita nel tuo Google Cloud Contratto) che collega i modelli Gemini ai dati web pubblici forniti dall'API di ricerca di Parallel Web Systems. Questo servizio consente a Gemini di accedere a informazioni in tempo reale da miliardi di pagine web per garantire risposte più aggiornate e oggettive.

Tieni presente quanto segue: l'utilizzo di Parallel richiede che Google Cloud invii determinati dati dei clienti all'offerta separata Parallel per l'elaborazione. L'utilizzo del servizio Parallel è regolato dai termini di utilizzo separati di Parallel e dalle norme di utilizzo accettabile di Parallel.

Casi d'uso

La fondatezza con Parallel è adatta a casi d'uso come i seguenti:

Utilizzo dei dati web per il completamento o l'arricchimento delle informazioni.
Agenti multihop che richiedono ricerche web più approfondite per domande più complesse.
Creazione di un'API che integra i dati della ricerca web.
Assistenti rivolti ai dipendenti che consentono all'utente finale di porre domande e creare report complessi utilizzando le informazioni web più recenti.
Applicazioni rivolte ai consumatori, come quelle per la vendita al dettaglio e i viaggi, che consentono all'utente di prendere decisioni di acquisto informate.
Agenti automatizzati che vengono eseguiti autonomamente per svolgere attività automatizzate, come l'analisi delle notizie e i controlli KYC.
Agenti verticali (agenti di vendita, agenti di programmazione, agenti finanziari) che ricevono il contesto più recente e aggiornato dal web.

Esempio

Chi ha vinto il Gran Premio di F1 di Las Vegas del 2025?

Senza grounding	Con messa a terra
Il Gran Premio di Las Vegas 2025 non si è ancora svolto. La gara è prevista per il fine settimana del 20-22 novembre 2025. Pertanto, il vincitore è attualmente sconosciuto.	Il vincitore del Gran Premio di F1 di Las Vegas 2025 è stato Max Verstappen di Red Bull Racing. La gara si è svolta il 22 novembre 2025. Fonti: domain1.com, domain2.com, ...

Modelli supportati

Questa sezione elenca i modelli che supportano il grounding con la ricerca web parallela.

Gemini 3 Flash Modello di anteprima
Gemini 3 Pro Modello di anteprima
Gemini 3 Pro Image Modello di anteprima
Gemini 2.5 Pro
Gemini 2.5 Flash Modello di anteprima
Gemini 2.5 Flash-Lite Modello di anteprima
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
Gemini 2.5 Flash con audio nativo dell'API Live (anteprima) Modello di anteprima
Gemini 2.0 Flash con API Live Modello di anteprima
Gemini 2.0 Flash

Prima di iniziare

Per utilizzare Grounding with Parallel, devi ottenere una chiave API dal sito web di Parallel. Questa chiave API viene utilizzata nella tua richiesta a Gemini.

Grounding delle risposte di Gemini con Parallel

Richiedi risposte basate su dati reali a Gemini utilizzando l'API REST come segue. Per ottenere prestazioni ottimali, ti consigliamo di utilizzare le impostazioni predefinite per i parametri facoltativi, a meno che tu non abbia strettamente bisogno di valori non predefiniti.

REST

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

LOCATION: La regione in cui elaborare la richiesta. Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su "global".
PROJECT_ID: l'ID progetto Google Cloud .
MODEL_ID: l'ID del modello da utilizzare.
TEXT: il prompt di testo da inviare al modello.
API_KEY: la tua chiave API per la ricerca parallela con l'AI.
EXCLUDE_DOMAINS: (Facoltativo) Elenco dei domini da escludere dalle fonti di base. Se specificate, le origini di questi domini vengono escluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
INCLUDE_DOMAINS: (facoltativo) elenco di domini da includere nelle fonti di base. Se specificate, le fonti di questi domini vengono incluse. I valori accettabili sono domini (www.example.com) o estensioni di dominio che iniziano con un punto ( .gov, .edu, .co.uk). Puoi specificare fino a 10 domini.
MAX_CHARS_PER_RESULT: facoltativo: il numero massimo di caratteri da includere in ogni estratto dei risultati di ricerca. Se non specificato, il valore predefinito è 30000. L'intervallo consentito è [1000, 100000].
MAX_CHARS_TOTAL: facoltativo: il numero massimo totale di caratteri di tutti gli estratti dei risultati di ricerca. Se non specificato, il valore predefinito è 100000. L'intervallo consentito è [1000, 1000000].
MAX_RESULTS: (facoltativo) Il numero massimo di risultati di ricerca da utilizzare per la base. Se non specificato, il valore predefinito è 10. L'intervallo consentito è [1, 20].

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corpo JSON della richiesta:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Per inviare la richiesta, espandi una di queste opzioni:

curl (Linux, macOS o Cloud Shell)

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Dovresti ricevere una risposta JSON simile alla seguente.

Risposta

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025. The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
          }
        ]
      },
      "finishReason": "STOP",
      "groundingMetadata": {
        "webSearchQueries": [
          "who won the last super bowl"
        ],
        "groundingChunks": [
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX",
              "domain": "domain.com"
            }
          },
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX Results",
              "domain": "domain.com"
            }
          }
        ],
        "groundingSupports": [
          {
            "segment": {
              "endIndex": 77,
              "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025."
            },
            "groundingChunkIndices": [
              0,
              1
            ]
          },
          {
            "segment": {
              "startIndex": 78,
              "endIndex": 198,
              "text": "The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
            },
            "groundingChunkIndices": [
              0
            ]
          },
        ]
      }
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 33,
    "candidatesTokenCount": 106,
    "totalTokenCount": 284,
    "billablePromptUsage": {
      "textCount": 142
    },
    "trafficType": "ON_DEMAND",
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 33
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 106
      }
    ],
    "toolUsePromptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 39
      }
    ],
    "toolUsePromptTokenCount": 39,
    "thoughtsTokenCount": 106
  },
  "modelVersion": "MODEL_VERSION",
  "createTime": "CREATE_TIME",
  "responseId": "RESPONSE_ID"
}

Quota

La quota predefinita è di 60 prompt al minuto. Se devi aumentare i limiti di frequenza, contatta support@parallel.ai e il tuo team dell'account Google con il tuo caso d'uso e i tuoi requisiti.

Fatturazione

L'utilizzo di Grounding con Parallel comporta i seguenti addebiti:

Utilizzo dei token di Gemini: token del prompt, token di ragionamento, token di output. Per ulteriori informazioni, vedi Prezzi.
Grounding di Gemini con i tuoi dati: per ulteriori informazioni, consulta la sezione Prezzi.
- I token di input forniti da Parallel non vengono addebitati a un costo aggiuntivo.
Prezzi per l'utilizzo dell'API di ricerca di Parallel: per ulteriori informazioni, consulta la pagina dei prezzi di Parallel.