Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Fundierung mit Parallel Web Search

Parallel Web Systems bietet eine Such-API, die Zugriff auf öffentlich verfügbare Webdaten bietet, die für die Verwendung durch große Sprach modelle zur Fundierung optimiert sind. Auf dieser Seite wird erläutert, wie Sie Gemini-Antworten mit Parallel fundieren.

Die Fundierung mit Parallel auf der Gemini Enterprise Agent Platform ist ein separates Angebot (wie definiert in Ihrer Google Cloud Vereinbarung), das Gemini-Modelle mit öffentlichen Webdaten verbindet, die von Parallel Web Systems' Such-API bereitgestellt werden. Dieser Dienst ermöglicht Gemini den Zugriff auf Live-Informationen von Milliarden von Webseiten, um aktuellere und faktenbasierte Antworten zu geben.

Hinweis: Für die Verwendung von Parallel muss Google Cloud bestimmte Kundendaten zur Verarbeitung an das separate Angebot von Parallel senden. Ihre Nutzung des Parallel-Dienstes unterliegt den separaten Nutzungsbedingungen und der Richtlinie zur akzeptablen Nutzung von Parallel.

Anwendungsfälle

Die Fundierung mit Parallel eignet sich für Anwendungsfälle wie die folgenden:

Webdaten zur Vervollständigung oder Anreicherung von Informationen verwenden.
Multi-Hop-Agents, die für komplexere Fragen tiefere Websuchen erfordern.
Eine API erstellen, die Websuchdaten integriert.
Mitarbeiterorientierte Assistenten, mit denen Endnutzer Fragen stellen und komplexe Berichte mit den neuesten Webinformationen erstellen können.
Anwendungen für Nutzer wie Einzelhandel und Reisen, mit denen Nutzer fundierte Kaufentscheidungen treffen können.
Automatisierte Agents, die autonom ausgeführt werden, um automatisierte Aufgaben wie Nachrichtenanalysen und KYC-Prüfungen durchzuführen.
Branchenspezifische Agents (Vertriebs-, Programmier- und Finanz-Agents), die den neuesten Kontext aus dem Web erhalten.

Beispiel

Wer hat den Formel-1-Grand-Prix von Las Vegas 2025 gewonnen?

Ohne Fundierung	Mit Fundierung
Der Grand Prix von Las Vegas 2025 hat noch nicht stattgefunden. Das Rennen ist für das Wochenende vom 20. bis 22. November 2025 geplant. Daher ist der Gewinner unbekannt.	Der Gewinner des Formel-1-Grand-Prix von Las Vegas 2025 war Max Verstappen von Red Bull Racing. Das Rennen fand am 22. November 2025 statt. Quellen:domain1.com, domain2.com, ...

Unterstützte Modelle

Die Fundierung mit der Parallel-Websuche wird von den folgenden Modellen unterstützt:

Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 3.1 Pro (gemini-3.1-pro-preview)
Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Hinweis

Wenn Sie die Fundierung mit Parallel verwenden möchten, müssen Sie einen API-Schlüssel von der Parallel-Website abrufen. Dieser API-Schlüssel wird in Ihrer Anfrage an Gemini verwendet.

Gemini-Antworten mit Parallel fundieren

Fordern Sie fundierte Antworten von Gemini an, indem Sie die REST API wie folgt verwenden. Für eine optimale Leistung empfehlen wir, die Standardeinstellungen für optionale Parameter zu verwenden, es sei denn, Sie benötigen unbedingt andere Werte.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

LOCATION: Die Region, in der die Anfrage verarbeitet werden soll. Wenn Sie den globalen Endpunkt verwenden möchten, schließen Sie den Standort aus dem Endpunktnamen aus und konfigurieren Sie den Standort der Ressource auf `global`.
PROJECT_ID: Ihre Google Cloud Projekt-ID
MODEL_ID: Die ID des Modells, das verwendet werden soll
TEXT: Der Text-Prompt, der an das Modell gesendet werden soll
API_KEY: Ihr API-Schlüssel für die Parallel.ai-Suche
EXCLUDE_DOMAINS: Optional: Liste der Domains, die von den Fundierungsquellen ausgeschlossen werden sollen. Wenn angegeben, werden Quellen aus diesen Domains ausgeschlossen. Zulässige Werte sind Domains (www.beispiel.de) oder Domain-Erweiterungen, die mit einem Punkt beginnen ( .gov, .edu, .co.uk). Sie können bis zu 10 Domains angeben.
INCLUDE_DOMAINS: Optional: Liste der Domains, die in die Fundierungsquellen aufgenommen werden sollen. Wenn angegeben, werden Quellen aus diesen Domains eingeschlossen. Zulässige Werte sind Domains (www.beispiel.de) oder Domain-Erweiterungen, die mit einem Punkt beginnen ( .gov, .edu, .co.uk). Sie können bis zu 10 Domains angeben.
MAX_CHARS_PER_RESULT: Optional: Die maximale Anzahl von Zeichen, die in jeden Suchergebnisauszug aufgenommen werden sollen. Wenn nichts angegeben ist, wird standardmäßig auf 30000 gesetzt. Der zulässige Bereich ist [1000, 100000].
MAX_CHARS_TOTAL: Optional: Die maximale Gesamtzahl der Zeichen aus allen Suchergebnisauszügen. Wenn nichts angegeben ist, wird standardmäßig 100000 verwendet. Der zulässige Bereich ist [1000, 1000000].
MAX_RESULTS: Optional: Die maximale Anzahl der Suchergebnisse, die für die Fundierung verwendet werden sollen. Wenn nichts angegeben ist, wird standardmäßig 10 verwendet. Der zulässige Bereich ist [1, 20].
MODE: Optional: Der für die Anfrage zu verwendende Modus, entweder one-shot oder fast. Der Standardwert ist one-shot. Verwenden Sie den Modus fast, wenn Sie die Latenz optimieren möchten.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

JSON-Text anfordern:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS,
            "mode": "MODE"
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:

curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt haben, die Sie automatisch in der gcloud-Befehlszeile anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:

Antwort

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025. The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
          }
        ]
      },
      "finishReason": "STOP",
      "groundingMetadata": {
        "webSearchQueries": [
          "who won the last super bowl"
        ],
        "groundingChunks": [
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX",
              "domain": "domain.com"
            }
          },
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX Results",
              "domain": "domain.com"
            }
          }
        ],
        "groundingSupports": [
          {
            "segment": {
              "endIndex": 77,
              "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025."
            },
            "groundingChunkIndices": [
              0,
              1
            ]
          },
          {
            "segment": {
              "startIndex": 78,
              "endIndex": 198,
              "text": "The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
            },
            "groundingChunkIndices": [
              0
            ]
          },
        ]
      }
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 33,
    "candidatesTokenCount": 106,
    "totalTokenCount": 284,
    "billablePromptUsage": {
      "textCount": 142
    },
    "trafficType": "ON_DEMAND",
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 33
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 106
      }
    ],
    "toolUsePromptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 39
      }
    ],
    "toolUsePromptTokenCount": 39,
    "thoughtsTokenCount": 106
  },
  "modelVersion": "MODEL_VERSION",
  "createTime": "CREATE_TIME",
  "responseId": "RESPONSE_ID"
}

Quota

Das Standardkontingent beträgt 200 Prompts pro Minute. Wenn Sie Ihre Ratenlimits erhöhen möchten, wenden Sie sich mit Ihrem Anwendungsfall und Ihren Anforderungen an support@parallel.ai und Ihr Google-Kontoteam.

Abrechnung

Für die Verwendung der Fundierung mit Parallel fallen die folgenden Gebühren an:

Gemini-Token-Verbrauch: Prompt-Tokens, Thinking-Tokens, Ausgabe-Tokens. Weitere Informationen finden Sie unter Preise.
Gemini-Fundierung mit Ihren Daten: Weitere Informationen finden Sie unter Preise.
- Für von Parallel bereitgestellte Eingabetokens werden keine zusätzlichen Gebühren erhoben.
Preise für die Verwendung der Such-API von Parallel: Weitere Informationen finden Sie auf der Preisseite von Parallel.