本文档列出了适用于 Model Armor 的配额和系统限制。
- 配额具有默认值,但您通常可以申请调整。
- 系统限制是无法更改的固定值。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用多少Google Cloud 资源。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级别应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
如需了解详情,请参阅 Cloud 配额概览。
API 查询配额
您可以在 Google Cloud 控制台中增加此配额,与其他 Google Cloud 服务类似。
| 配额 | 值 |
|---|---|
| API 查询 | 每个项目每分钟 1,200 次查询 (QPM) |
输入大小系统限制
下表指定了输入文件或文本大小的系统限制。
| 系统限制 | 值 |
|---|---|
| 所有受支持的文件和文本 | 4 MB |
token 系统限制
Model Armor 具有不同的系统 token 限制,具体取决于特定的过滤条件。
| 过滤 | 系统限制 |
|---|---|
| 提示注入和越狱检测 | 10,000 |
| Responsible AI | 10,000 |
| 儿童性虐待内容 | 10,000 |
| Sensitive Data Protection | 130000 个 |
如果提示或回答超出 token 限制,Sensitive Data Protection 过滤条件会返回 EXECUTION_SKIPPED。如果提示或回答超出 token 限制,所有其他过滤条件在发现前 10,000 个 token 中包含恶意内容时返回 MATCH_FOUND,在前 10,000 个 token 中未发现恶意内容时返回 EXECUTION_SKIPPED。
获取配额和系统限制指标名称
配额和系统限制有两种类型的名称:显示名称和指标名称。显示名称包含空格和大写字母,更便于人类阅读。指标名称更可能是小写形式,并使用下划线而非空格作为分隔符;确切的格式取决于服务。
以下说明介绍了如何使用 Google Cloud 控制台或 gcloud CLI 获取配额和系统限制的指标名称。
控制台
在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:
本页面的表格会显示具有用量或具有调整值的配额和系统限制,以及其他配额的引用条目。引用条目在名称列的列表末尾的括号中有“default”字样。例如,
SetIAMPolicy requests per minute per region (default)是配额SetIamPolicyRequestsPerMinutePerProject的引用条目。如果您没有看到指标列,请执行以下步骤。
- 点击 列显示选项。
- 选择指标。
- 点击确定。表格中会显示指标列。
指标列显示指标名称。如需过滤结果,请在 过滤条件旁边的字段中输入属性名称或值。
gcloud
如需使用 gcloud CLI 获取 Google Cloud 服务的指标名称,请运行 quotas info list 命令。如需跳过未列出指标名称的行,请将输出传递给 grep 等命令,并将 metric: 作为搜索字词,或者使用 gcloud CLI --format 标志:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
替换以下内容:
PROJECT_ID_OR_NUMBER:项目 ID 或项目编号。SERVICE_NAME:您要查看其配额指标的服务的名称,例如 Compute Engine 的服务名称为compute.googleapis.com。包含服务名称的googleapis.com部分。
申请配额调整
如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整。