在 Gemini Enterprise Agent Platform 上使用 Parallel 进行事实依据核查是一项单独的服务(如您的 Google Cloud 协议中所述),可将 Gemini 模型连接到 Parallel Web Systems 的搜索 API 提供的公开网络数据。借助此服务,Gemini 可以访问数十亿网页中的实时信息,从而确保回答更及时、更准确。
请注意以下事项:您使用 Parallel 需要 Google Cloud 将某些客户数据发送给 Parallel 独立产品/服务进行处理。您对 Parallel 服务的使用受 Parallel 的单独使用条款和 Parallel 的使用政策约束。
使用场景
使用 Parallel 进行依据建立适用于以下用例:
- 使用网络数据来完成或扩充信息。
- 需要更深入地搜索网络才能回答更复杂问题的多步代理。
- 构建可集成网络搜索数据的 API。
- 面向员工的助理,可让最终用户使用最新的网络信息提出问题并创建复杂的报告。
- 面向消费者的应用,例如零售和旅游应用,可让用户做出明智的购买决策。
- 自主运行以执行自动化任务(例如新闻分析和 KYC 检查)的自动化智能体。
- 垂直领域的代理(销售代理、编码代理、财务代理)从网络获取最新的最新信息。
示例
谁赢得了 2025 年拉斯维加斯 F1 大奖赛?
| 无标准答案关联 | 带接地 |
|---|---|
| 2025 年拉斯维加斯大奖赛尚未举行。该赛事计划于 2025 年 11 月 20 日至 22 日的周末举行。因此,目前尚不清楚谁会获胜。 | 2025 年拉斯维加斯 F1 大奖赛的获胜者是红牛车队的马克斯·维斯塔潘。比赛于 2025 年 11 月 22 日举行。 来源:domain1.com、domain2.com 等。 |
支持的模型
以下模型支持依托 Parallel Web Search 进行接地:
- Gemini 2.5 Flash (
gemini-2.5-flash) - Gemini 2.5 Flash-Lite (
gemini-2.5-flash-lite) - Gemini 2.5 Pro (
gemini-2.5-pro) - Gemini 3.1 Pro (
gemini-3.1-pro-preview) - Gemini 3 Flash Lite (
gemini-3-flash-lite-preview)
准备工作
如需将 Grounding 与 Parallel 搭配使用,您需要从 Parallel 的网站获取 API 密钥。此 API 密钥用于向 Gemini 发出的请求中。
使用 Parallel 将 Gemini 回答接地
使用 REST API 向 Gemini 请求有事实依据的回答,如下所示。为获得最佳性能,我们建议您对可选参数使用默认设置,除非您严格要求使用非默认值。
REST
在使用任何请求数据之前,请先进行以下替换:
- LOCATION:处理请求的区域。如需使用全球端点,请清除端点名称中的相应位置,并将资源位置配置为“global”。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- MODEL_ID:要使用模型的 ID。
- TEXT:要发送给模型的文本提示。
- API_KEY:Parallel AI Search 的 API 密钥。
- EXCLUDE_DOMAINS:可选:要从接地源中排除的网域列表。如果指定,则排除来自这些网域的来源。 可接受的值为网域 (www.example.com) 或以英文句点开头的网域扩展名(.gov、.edu、.co.uk)。您最多可以指定 10 个网域。
- INCLUDE_DOMAINS:可选:要纳入接地源的网域列表。如果指定,则会包含来自这些网域的来源。 可接受的值为网域 (www.example.com) 或以英文句点开头的网域扩展名(.gov、.edu、.co.uk)。您最多可以指定 10 个网域。
- MAX_CHARS_PER_RESULT:可选:每个搜索结果摘要中包含的最大字符数。如果未指定,则默认为
30000。允许的范围为[1000, 100000]。 - MAX_CHARS_TOTAL:可选:所有搜索结果摘要的总字符数上限。如果未指定,则默认为
100000。允许的范围为[1000, 1000000]。 - MAX_RESULTS:可选:用于接地的搜索结果数量上限。如果未指定,则默认为
10。允许的范围为[1, 20]。 - MODE:可选:用于请求的模式,可以是
one-shot或fast。默认值为one-shot。 如果您想优化延迟时间,请考虑使用fast模式。
HTTP 方法和网址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
请求 JSON 正文:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS,
"mode": "MODE"
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应。
配额
默认配额为每分钟 200 个提示。如果您需要提高速率限制,请发送电子邮件至 support@parallel.ai,并向您的 Google 客户支持团队说明您的使用情形和要求。
结算
使用“依托 Parallel 进行接地”功能会产生以下费用:
- Gemini token 消耗:提示 token、思考 token、输出 token。如需了解详情,请参阅价格。
- Gemini 利用数据进行接地:如需了解详情,请参阅价格。
- Parallel 提供的输入令牌不会额外收费。
- 使用 Parallel 的搜索 API 的价格:如需了解详情,请参阅 Parallel 的价格页面。