以 Parallel Web Search 建立基準

Parallel Web Systems 提供搜尋 API,可存取公開網路資料,並經過最佳化處理,方便大型語言模型做為基準。本頁說明如何使用 Parallel,根據特定資料來源生成 Gemini 回覆。

在 Gemini Enterprise Agent Platform 上使用 Parallel 基礎模型是獨立的服務 (如 Google Cloud 合約中所定義),可將 Gemini 模型連結至 Parallel Web Systems 的搜尋 API 提供的公開網路資料。這項服務可讓 Gemini 存取數十億個網頁的即時資訊,確保回覆內容更貼近現況且正確無誤。

請注意以下事項:使用 Parallel 時,Google Cloud 必須將特定客戶資料傳送至 Parallel 獨立服務進行處理。使用 Parallel 服務時,須遵守 Parallel 的獨立使用條款Parallel 的使用政策

用途

使用 Parallel 建立基準適用於下列用途:

  • 使用網路資料完成或豐富資訊。
  • 多跳代理程式:針對較複雜的問題,需要進行更深入的網路搜尋。
  • 建構整合網路搜尋資料的 API。
  • 員工專用助理,可讓使用者提問及使用最新網路資訊建立複雜報表。
  • 面向消費者的應用程式,例如零售和旅遊,可讓使用者做出明智的購買決策。
  • 自動代理會自主執行自動化工作,例如新聞分析和 KYC 檢查。
  • 垂直代理 (銷售代理、程式設計代理、財務代理) 從網路上取得最新資訊。

範例

2025 年拉斯維加斯 F1 大獎賽的冠軍是誰?

沒有連結 含接地線
2025 年拉斯維加斯大獎賽尚未舉行,預計於 2025 年 11 月 20 日至 22 日的週末舉行,因此目前還不知道誰會獲勝。 2025 年拉斯維加斯 F1 大獎賽的冠軍是紅牛車隊的 Max Verstappen,比賽於 2025 年 11 月 22 日舉行。 資料來源:domain1.com、domain2.com 等。

支援的模型

下列模型支援「以 Parallel Web Search 建立基準」功能:

  • Gemini 2.5 Flash (gemini-2.5-flash)
  • Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
  • Gemini 2.5 Pro (gemini-2.5-pro)
  • Gemini 3.1 Pro (gemini-3.1-pro-preview)
  • Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

事前準備

如要搭配 Parallel 使用 Grounding,請前往 Parallel 網站取得 API 金鑰。這個 API 金鑰會用於對 Gemini 發出的要求。

以 Parallel 建立 Gemini 回覆的基準

如要透過 REST API 要求 Gemini 提供有根據的回覆,請按照下列步驟操作。為獲得最佳效能,除非您有非預設值的嚴格需求,否則建議使用選用參數的預設設定。

REST

使用任何要求資料之前,請先修改下列項目的值:

  • LOCATION:處理要求的區域。如要使用全域端點,請從端點名稱中排除位置,並將資源位置設為「global」。
  • PROJECT_ID: Google Cloud 專案 ID。
  • MODEL_ID:要使用的模型 ID。
  • TEXT:要傳送至模型的文字提示。
  • API_KEY:Parallel AI Search 的 API 金鑰。
  • EXCLUDE_DOMAINS:選用:要從基礎來源排除的網域清單。如果指定,系統會排除這些網域的來源。 可接受的值為網域 (www.example.com) 或以半形句號開頭的網域副檔名 (.gov、.edu、.co.uk)。最多可指定 10 個網域。
  • INCLUDE_DOMAINS:選用:要納入基礎來源的網域清單。如果指定,系統會納入這些網域的來源。可接受的值包括網域 (www.example.com) 或以半形句號開頭的網域副檔名 (.gov、.edu、.co.uk)。最多可指定 10 個網域。
  • MAX_CHARS_PER_RESULT:選用:每個搜尋結果摘要中包含的字元數上限。如未指定,預設為 30000。允許的範圍為 [1000, 100000]
  • MAX_CHARS_TOTAL:選用:所有搜尋結果摘要的總字元數上限。如未指定,則預設為 100000。允許的範圍為 [1000, 1000000]
  • MAX_RESULTS:選用:用於基礎的搜尋結果數量上限。如未指定,預設值為 10。允許的範圍為 [1, 20]
  • MODE:選用:用於要求的模式,可以是 one-shotfast。預設值為 one-shot。如要盡量縮短延遲時間,請考慮使用 fast 模式。

HTTP 方法和網址:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

JSON 要求主體:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS,
            "mode": "MODE"
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

請展開以下其中一個選項,以傳送要求:

您應該會收到類似如下的 JSON 回應。

配額

預設配額為每分鐘 200 個提示。如要提高速率限制,請透過 support@parallel.ai 與 Google 帳戶團隊聯絡,並說明您的用途和需求。

帳單

使用 Grounding with Parallel 會產生下列費用:

  • Gemini 詞元用量:提示詞詞元、思考詞元、輸出內容詞元。詳情請參閱「定價」。
  • Gemini 根據您的資料提供資訊:詳情請參閱定價
    • 使用 Parallel 時,輸入的詞元不需支付額外費用。
  • 使用 Parallel 搜尋 API 的定價:詳情請參閱 Parallel 的定價頁面