配额和系统限制

本文档列出了 Gemini Enterprise 的配额和系统限制。系统限制是无法更改的固定值。与其他 Google Cloud 服务不同,Gemini Enterprise 配额不需要手动申请增加。配额会根据您购买的许可或席位的数量自动调整。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用多少Google Cloud 资源。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级别应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

如需了解详情,请参阅 Cloud 配额概览

Gemini Enterprise 资源也有系统限制。系统限制不能更改。

如需了解 Gemini Enterprise 的超额使用费,请参阅 配额和超额使用费

分配配额

下表列出了 Discovery Engine API 的配额。 这些配额不会在一段时间后重置,而是在您释放资源时释放。

Quota
每个项目的数据存储区总数 1001
每个项目的引擎总数 1502
每个位置(全球、美国、欧盟)中每个项目的区域数据存储区数量 100
每个位置(全球、美国、欧盟)中每个项目的区域文档数量 1000 万
每个位置(全球、美国、欧盟)中每个项目的区域引擎数量 150

1 由于技术限制,每个项目的数据存储区配额上限为 500。如果您需要更多数据存储区,请使用新项目。
数据存储区中的每个实体都计为一个数据存储区实例,因此会占用此配额。例如,如果数据存储区包含三个 实体,则会占用配额中的三个数据存储区。

2 由于技术限制,每个项目的引擎配额上限为 500 。如果您需要更多引擎,请使用新项目。

速率配额

以下配额适用于 Discovery Engine API 请求。

Quota
每个项目每分钟的完整查询请求数 300
每个位置(全球、美国、欧盟)中每个项目的每分钟区域搜索请求数 300