Parallel Web Systems bietet eine Such-API, die Zugriff auf öffentlich verfügbare Webdaten bietet, die für die Verwendung durch Large Language Models zur Fundierung optimiert sind. Auf dieser Seite wird erläutert, wie Sie Gemini-Antworten mit Parallel fundieren.
Die Fundierung mit Parallel on Vertex AI ist ein separates Angebot (wie in Ihrer Google Cloud Vereinbarung definiert), das Gemini-Modelle mit öffentlichen Webdaten verbindet, die von der Such-API von Parallel Web Systems bereitgestellt werden. Dieser Dienst ermöglicht Gemini den Zugriff auf aktuelle Informationen von Milliarden von Webseiten, um aktuellere und faktenbasiertere Antworten zu liefern.
Bitte beachten Sie Folgendes: Für die Nutzung von Parallel muss Google Cloud bestimmte Kundendaten zur Verarbeitung an das separate Angebot Parallel senden. Ihre Nutzung des Parallel-Dienstes unterliegt den separaten Nutzungsbedingungen von Parallel und der Richtlinie zur zulässigen Nutzung von Parallel.
Anwendungsfälle
Die Fundierung mit Parallel eignet sich für Anwendungsfälle wie die folgenden:
- Webdaten zum Vervollständigen oder Anreichern von Informationen verwenden.
- Multi-Hop-Agents, die für komplexere Fragen umfassendere Websuchen erfordern.
- Entwicklung einer API, in die Websuchdaten eingebunden werden.
- Mitarbeiterorientierte Assistenten, mit denen Endnutzer Fragen stellen und komplexe Berichte mit den neuesten Webinformationen erstellen können.
- Verbraucherorientierte Anwendungen wie Einzelhandel und Reisen, die es dem Nutzer ermöglichen, fundierte Kaufentscheidungen zu treffen.
- Automatisierte Agents, die autonom ausgeführt werden, um automatisierte Aufgaben wie Nachrichtenanalyse und KYC-Prüfungen durchzuführen.
- Vertikale Agenten (Vertriebs-, Programmier- und Finanz-Agents) erhalten den neuesten Kontext aus dem Web.
Beispiel
Wer hat den F1 Grand Prix von Las Vegas 2025 gewonnen?
| Ohne Fundierung | Mit Erdung |
|---|---|
| Der Las Vegas Grand Prix 2025 hat noch nicht stattgefunden. Das Rennen findet planmäßig am Wochenende vom 20. bis 22. November 2025 statt. Daher ist der Gewinner derzeit unbekannt. | Der Gewinner des Formel-1-Grand-Prix von Las Vegas 2025 war Max Verstappen von Red Bull Racing. Das Rennen fand am 22. November 2025 statt. Quellen: domain1.com, domain2.com, … |
Unterstützte Modelle
In diesem Abschnitt werden die Modelle aufgeführt, die die Fundierung mit paralleler Websuche unterstützen.
- Gemini 3 Flash Vorschaumodell
- Gemini 3 Pro Vorschaumodell
- Gemini 3 Pro Image Vorschaumodell
- Gemini 2.5 Pro
- Gemini 2.5 Flash Vorschaumodell
- Gemini 2.5 Flash-Lite Vorschaumodell
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
- Gemini 2.5 Flash mit Live API-nativem Audio (Vorschau) Vorschaumodell
- Gemini 2.0 Flash mit Live API Vorschaumodell
- Gemini 2.0 Flash
Hinweise
Wenn Sie Grounding mit Parallel verwenden möchten, müssen Sie einen API-Schlüssel von der Website von Parallel abrufen. Dieser API-Schlüssel wird in Ihrer Anfrage an Gemini verwendet.
Gemini-Antworten mit Parallel fundieren
So fordern Sie fundierte Antworten von Gemini über die REST API an: Für eine optimale Leistung empfehlen wir, die Standardeinstellungen für optionale Parameter zu verwenden, sofern Sie nicht unbedingt andere Werte benötigen.
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll. Wenn Sie den globalen Endpunkt verwenden möchten, schließen Sie den Standort aus dem Endpunktnamen aus und konfigurieren Sie den Standort der Ressource auf „global“.
- PROJECT_ID: Ihre Google Cloud Projekt-ID
- MODEL_ID: Die ID des Modells, das verwendet werden soll
- TEXT: Der Text-Prompt, der an das Modell gesendet werden soll.
- API_KEY: Ihr API-Schlüssel für Parallel AI Search.
- EXCLUDE_DOMAINS: Optional: Liste der Domains, die von den Fundierungsquellen ausgeschlossen werden sollen. Wenn angegeben, werden Quellen aus diesen Domains ausgeschlossen. Zulässige Werte sind Domains (www.beispiel.de) oder Domain-Endungen, die mit einem Punkt beginnen (.gov, .edu, .co.uk). Sie können bis zu 10 Domains angeben.
- INCLUDE_DOMAINS: Optional: Liste der Domains, die in die Fundierungsquellen aufgenommen werden sollen. Falls angegeben, werden Quellen aus diesen Domains berücksichtigt. Zulässige Werte sind Domains (www.beispiel.de) oder Domain-Endungen, die mit einem Punkt beginnen (.gov, .edu, .co.uk). Sie können bis zu 10 Domains angeben.
- MAX_CHARS_PER_RESULT: Optional: Die maximale Anzahl von Zeichen, die in jedem Suchergebnis-Auszug enthalten sein sollen. Wenn nichts angegeben ist, wird standardmäßig
30000verwendet. Der zulässige Bereich ist[1000, 100000]. - MAX_CHARS_TOTAL: Optional: Die maximale Gesamtzahl der Zeichen aus allen Auszügen der Suchergebnisse. Enthält standardmäßig den Wert
100000, wenn nichts anderes angegeben ist. Der zulässige Bereich ist[1000, 1000000]. - MAX_RESULTS: Optional: Die maximale Anzahl der Suchergebnisse, die für die Fundierung verwendet werden sollen. Enthält standardmäßig den Wert
10, wenn nichts anderes angegeben ist. Der zulässige Bereich ist[1, 20].
HTTP-Methode und URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
JSON-Text anfordern:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
Kontingent
Das Standardkontingent beträgt 60 Prompts pro Minute. Wenn Sie Ihre Ratenbeschränkungen erhöhen müssen, wenden Sie sich mit Ihrem Anwendungsfall und Ihren Anforderungen an support@parallel.ai und Ihr Google-Kontoteam.
Abrechnung
Für die Verwendung von Grounding mit Parallel fallen die folgenden Gebühren an:
- Gemini-Tokenverbrauch: Prompt-Tokens, Thinking-Tokens, Ausgabe-Tokens. Weitere Informationen finden Sie unter Preise.
- Fundierung von Gemini auf Ihren Daten: Weitere Informationen finden Sie unter Preise.
- Für Eingabetokens, die von Parallel bereitgestellt werden, fallen keine zusätzlichen Kosten an.
- Preise für die Verwendung der Such-API von Parallel: Weitere Informationen finden Sie auf der Preisseite von Parallel.