配额和系统限制

本文档列出了适用于 Model Armor 的配额和系统限制。

  • 配额具有默认值,但您通常可以申请调整。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用多少Google Cloud 资源。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级别应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

如需了解详情,请参阅 Cloud 配额概览

API 查询配额

您可以在 Google Cloud 控制台中增加此配额,与其他 Google Cloud 服务类似。

配额
API 查询 每个项目每分钟 1,200 次查询 (QPM)

输入大小系统限制

下表指定了输入文件或文本大小的系统限制。

系统限制
所有受支持的文件和文本 4 MB

token 系统限制

Model Armor 具有不同的系统 token 限制,具体取决于特定的过滤条件。

过滤 系统限制
提示注入和越狱检测 10,000
Responsible AI 10,000
儿童性虐待内容 10,000
Sensitive Data Protection 130000 个

如果提示或回答超出 token 限制,Sensitive Data Protection 过滤条件会返回 EXECUTION_SKIPPED。如果提示或回答超出 token 限制,所有其他过滤条件在发现前 10,000 个 token 中包含恶意内容时返回 MATCH_FOUND,在前 10,000 个 token 中未发现恶意内容时返回 EXECUTION_SKIPPED

获取配额和系统限制指标名称

配额和系统限制有两种类型的名称:显示名称和指标名称。显示名称包含空格和大写字母,更便于人类阅读。指标名称更可能是小写形式,并使用下划线而非空格作为分隔符;确切的格式取决于服务。

以下说明介绍了如何使用 Google Cloud 控制台或 gcloud CLI 获取配额和系统限制的指标名称。

控制台

  1. 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:

    进入“配额和系统限制”

    本页面的表格会显示具有用量或具有调整值的配额和系统限制,以及其他配额的引用条目。引用条目在名称列的列表末尾的括号中有“default”字样。例如,SetIAMPolicy requests per minute per region (default) 是配额 SetIamPolicyRequestsPerMinutePerProject 的引用条目。

  2. 如果您没有看到指标列,请执行以下步骤。

    1. 点击 列显示选项
    2. 选择指标
    3. 点击确定。表格中会显示指标列。

指标列显示指标名称。如需过滤结果,请在 过滤条件旁边的字段中输入属性名称或值。

gcloud

如需使用 gcloud CLI 获取 Google Cloud 服务的指标名称,请运行 quotas info list 命令。如需跳过未列出指标名称的行,请将输出传递给 grep 等命令,并将 metric: 作为搜索字词,或者使用 gcloud CLI --format 标志:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

替换以下内容:

  • PROJECT_ID_OR_NUMBER:项目 ID 或项目编号。
  • SERVICE_NAME:您要查看其配额指标的服务的名称,例如 Compute Engine 的服务名称为 compute.googleapis.com。包含服务名称的 googleapis.com 部分。

申请配额调整

如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整