本文档列出了 Gemini Enterprise 的配额和系统限制。系统限制是无法更改的固定值。与其他 Google Cloud 服务不同,Gemini Enterprise 配额不需要手动申请增加。配额会根据您购买的许可或席位的数量自动调整。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用多少Google Cloud 资源。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级别应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
如需了解详情,请参阅 Cloud 配额概览。
Gemini Enterprise 资源也有系统限制。系统限制不能更改。
如需了解 Gemini Enterprise 的超额使用费,请参阅 配额和超额使用费。
分配配额
下表列出了 Discovery Engine API 的配额。 这些配额不会在一段时间后重置,而是在您释放资源时释放。
| Quota | 值 |
|---|---|
| 每个项目的数据存储区总数 | 1001 |
| 每个项目的引擎总数 | 1502 |
| 每个位置(全球、美国、欧盟)中每个项目的区域数据存储区数量 | 100 |
| 每个位置(全球、美国、欧盟)中每个项目的区域文档数量 | 1000 万 |
| 每个位置(全球、美国、欧盟)中每个项目的区域引擎数量 | 150 |
1 由于技术限制,每个项目的数据存储区配额上限为
500。如果您需要更多数据存储区,请使用新项目。
数据存储区中的每个实体都计为一个数据存储区实例,因此会占用此配额。例如,如果数据存储区包含三个
实体,则会占用配额中的三个数据存储区。
2 由于技术限制,每个项目的引擎配额上限为 500 。如果您需要更多引擎,请使用新项目。
速率配额
以下配额适用于 Discovery Engine API 请求。
| Quota | 值 |
|---|---|
| 每个项目每分钟的完整查询请求数 | 300 |
| 每个位置(全球、美国、欧盟)中每个项目的每分钟区域搜索请求数 | 300 |