Parallel Web Systems 提供了一个搜索 API,可用于访问公开提供的网络数据,这些数据经过优化,可供大语言模型用于建立依据。本页介绍了如何使用 Parallel 来提供接地回答。
依托 Parallel on Vertex AI 进行接地是一项单独的服务(如您的 Google Cloud 协议中所述),可将 Gemini 模型连接到 Parallel Web Systems 的搜索 API 提供的公开网络数据。借助此服务,Gemini 可以访问数十亿个网页中的实时信息,从而确保回答更贴近事实且更及时。
请注意以下事项:您使用 Parallel 需要 Google Cloud 将某些客户数据发送到 Parallel 独立产品/服务以进行处理。您对 Parallel 服务的使用受 Parallel 的单独使用条款和 Parallel 的使用政策约束。
使用场景
使用 Parallel 进行依据建立适用于以下应用场景:
- 使用网络数据来完成或扩充信息。
- 需要更深入地进行网页搜索才能回答更复杂问题的多跳代理。
- 构建集成网络搜索数据的 API。
- 面向员工的助理,可让最终用户使用最新的网络信息提出问题并创建复杂的报告。
- 面向消费者的应用,例如零售和旅游应用,可让用户做出明智的购买决策。
- 可自主运行以执行自动化任务(例如新闻分析和 KYC 检查)的自动化代理。
- 垂直领域的智能体(销售智能体、编码智能体、财务智能体)从网络获取最新的最新背景信息。
示例
谁赢得了 2025 年拉斯维加斯 F1 大奖赛?
| 不含标准答案关联 | 带接地 |
|---|---|
| 2025 年拉斯维加斯大奖赛尚未举行。该赛事计划于 2025 年 11 月 20 日至 22 日的周末举行。 因此,目前尚不清楚谁是获胜者。 | 2025 年拉斯维加斯 F1 大奖赛的获胜者是 Red Bull Racing 的 Max Verstappen。比赛于 2025 年 11 月 22 日举行。 来源:domain1.com、domain2.com 等 |
支持的模型
本部分列出了支持“依托并行 Web 搜索进行接地”的模型。
- Gemini 3 Flash 预览版模型
- Gemini 3 Pro 预览版模型
- Gemini 3 Pro Image 预览版模型
- Gemini 2.5 Pro
- Gemini 2.5 Flash 预览版模型
- Gemini 2.5 Flash-Lite 预览版模型
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能)
- 支持 Live API 原生音频的 Gemini 2.5 Flash(预览版) 预览版模型
- 支持 Live API 的 Gemini 2.0 Flash 预览版模型
- Gemini 2.0 Flash
准备工作
如需将接地与 Parallel 搭配使用,您需要从 Parallel 的网站获取 API 密钥。此 API 密钥用于向 Gemini 发出的请求中。
使用 Parallel 将 Gemini 回答接地
使用 REST API 向 Gemini 请求接地回答,如下所示。为了获得最佳性能,我们建议您为可选参数使用默认设置,除非您严格要求使用非默认值。
REST
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理请求的区域。如需使用全球端点,请清除端点名称中的相应位置,并将资源位置配置为“global”。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- MODEL_ID:要使用模型的 ID。
- TEXT:要发送给模型的文本提示。
- API_KEY:Parallel AI Search 的 API 密钥。
- EXCLUDE_DOMAINS:可选:要从接地源中排除的网域列表。如果指定,则排除来自这些网域的来源。 可接受的值为域名 (www.example.com) 或以英文句点开头的域名扩展名(.gov、.edu、.co.uk)。您最多可以指定 10 个网域。
- INCLUDE_DOMAINS:可选:要纳入接地源的网域列表。如果指定,则会包含来自这些网域的来源。 可接受的值为域名 (www.example.com) 或以英文句点开头的域名扩展名(.gov、.edu、.co.uk)。您最多可以指定 10 个网域。
- MAX_CHARS_PER_RESULT:可选:每个搜索结果摘要中包含的最大字符数。如果未指定,则默认为
30000。允许的范围为[1000, 100000]。 - MAX_CHARS_TOTAL(可选):所有搜索结果摘录中的最大总字符数。如果未指定,则默认为
100000。 允许的范围为[1000, 1000000]。 - MAX_RESULTS:可选:用于接地的搜索结果数量上限。如果未指定,则默认为
10。允许的范围为[1, 20]。
HTTP 方法和网址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
请求 JSON 正文:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应。
配额
默认配额为每分钟 60 个提示。如果您需要提高速率限制,请发送电子邮件至 support@parallel.ai,并向您的 Google 客户支持团队说明您的使用情形和要求。
结算
将“依托 Parallel 进行接地”与 Parallel 搭配使用会产生以下费用:
- Gemini token 消耗:提示 token、思考 token、输出 token。如需了解详情,请参阅价格。
- Gemini 利用数据进行接地:如需了解详情,请参阅价格。
- Parallel 提供的输入令牌不会产生额外费用。
- 使用 Parallel 的搜索 API 的价格:如需了解详情,请参阅 Parallel 的价格页面。