Parallel Web Systems 提供搜尋 API,可存取公開的網路資料,並經過最佳化處理,方便大型語言模型做為基準。本頁說明如何使用 Parallel,根據特定來源生成 Gemini 回覆。
Vertex AI 的 Parallel 基礎功能是獨立的產品 (如 Google Cloud 合約中所定義),可將 Gemini 模型連結至 Parallel Web Systems 的 Search API 提供的公開網路資料。這項服務可讓 Gemini 存取數十億個網頁的即時資訊,確保回覆內容更符合事實且與時俱進。
請注意下列事項:如要使用 Parallel,Google Cloud 必須將特定客戶資料傳送至 Parallel 獨立服務進行處理。使用 Parallel 服務時,須遵守 Parallel 的獨立使用條款和 Parallel 的使用政策。
用途
使用 Parallel 建立基準適用於下列用途:
- 使用網路資料完成或豐富資訊。
- 多重跳轉代理程式,可針對更複雜的問題進行更深入的網路搜尋。
- 建構整合網路搜尋資料的 API。
- 員工專用助理,可讓使用者提問及使用最新網路資訊建立複雜報表。
- 面向消費者的應用程式,例如零售和旅遊,可協助使用者做出明智的購買決定。
- 自動代理會自主執行自動化工作,例如新聞分析和 KYC 檢查。
- 垂直領域的服務專員 (銷售專員、程式碼專員、財務專員) 從網路上取得最新資訊。
範例
誰贏得 2025 年拉斯維加斯 F1 大獎賽?
| 沒有連結 | 含接地線 |
|---|---|
| 2025 年的拉斯維加斯大獎賽尚未舉行,這場賽事預計於 2025 年 11 月 20 日至 22 日的週末舉行。因此目前還不知道誰是贏家。 | 2025 年拉斯維加斯 F1 大獎賽的冠軍是 Red Bull Racing 的 Max Verstappen。賽事於 2025 年 11 月 22 日舉行。 來源:domain1.com、domain2.com 等 |
支援的模型
本節列出支援平行網頁搜尋基礎模型的模型。
- Gemini 3 Flash 預先發布版模型
- Gemini 3 Pro 預先發布版模型
- Gemini 3 Pro Image 預先發布版模型
- Gemini 2.5 Pro
- Gemini 2.5 Flash 預先發布版模型
- Gemini 2.5 Flash-Lite 預先發布版模型
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊
- Gemini 2.5 Flash (支援 Live API 原生音訊) (預先發布版) 預先發布版模型
- Gemini 2.0 Flash with Live API 預先發布版模型
- Gemini 2.0 Flash
事前準備
如要使用 Grounding with Parallel,請前往 Parallel 網站取得 API 金鑰。這個 API 金鑰會用於對 Gemini 發出的要求。
讓 Gemini 回覆奠基於 Parallel
如要要求 Gemini 提供有根據的回覆,請使用 REST API,如下所示。為獲得最佳成效,建議您使用選用參數的預設設定,除非您嚴格要求非預設值。
REST
使用任何要求資料之前,請先修改下列項目的值:
- LOCATION:處理要求的區域。如要使用全域端點,請從端點名稱中排除位置,並將資源位置設為「global」。
- PROJECT_ID: Google Cloud 專案 ID。
- MODEL_ID:要使用的模型 ID。
- TEXT:要傳送至模型的文字提示。
- API_KEY:Parallel AI Search 的 API 金鑰。
- EXCLUDE_DOMAINS:選用:要從基礎來源排除的網域清單。如果指定了網域,系統會排除這些網域的來源。 可接受的值為網域 (www.example.com) 或以半形句號開頭的網域副檔名 (.gov、.edu、.co.uk)。最多可指定 10 個網域。
- INCLUDE_DOMAINS:選用:要納入基礎來源的網域清單。如有指定,系統會納入這些網域的來源。 可接受的值為網域 (www.example.com) 或以半形句號開頭的網域副檔名 (.gov、.edu、.co.uk)。最多可指定 10 個網域。
- MAX_CHARS_PER_RESULT:選用:每個搜尋結果摘要中包含的字元數上限。如未指定,則預設為
30000。允許的範圍為[1000, 100000]。 - MAX_CHARS_TOTAL:選用:所有搜尋結果摘要的總字元數上限。如未指定,則預設為
100000。允許的範圍為[1000, 1000000]。 - MAX_RESULTS:(選填) 用於基礎的搜尋結果數量上限。如未指定,則預設為
10。允許的範圍為[1, 20]。
HTTP 方法和網址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
JSON 要求主體:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
請展開以下其中一個選項,以傳送要求:
您應該會收到類似如下的 JSON 回應。
配額
預設配額為每分鐘 60 個提示。如需提高速率限制,請透過 support@parallel.ai 聯絡 Google 帳戶團隊,並說明您的用途和需求。
帳單
使用 Grounding with Parallel 會產生下列費用:
- Gemini 詞元用量:提示詞詞元、思考詞元、輸出內容詞元。詳情請參閱「定價」。
- Gemini 根據您的資料提供資訊:詳情請參閱定價。
- 使用 Parallel 提供的輸入權杖不會產生額外費用。
- 使用 Parallel 搜尋 API 的定價:詳情請參閱 Parallel 的定價頁面。