配额和系统限制

本文档列出了适用于 Model Armor 的配额和系统限制。

  • 配额具有默认值,但您通常可以申请 调整。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用多少Google Cloud 资源。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级别应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

如需了解详情,请参阅 Cloud 配额概览

Model Armor API 配额

下表指定了 Model Armor API 的配额。

Quota
API 查询 每个项目每分钟 1,200 次查询 (QPM)
对 ExternalProcessor 的请求 每个项目 600 QPM 1

您可以应用介于 0 到 1,200 QPM 之间的值。如需申请调整, 请参阅申请配额调整。 如果您需要的配额超出默认配额,请与 Cloud Customer Care 团队联系。

如需了解与 Model Armor 与 其他服务集成相关的配额,请参阅管理配额

1 如果您将 Model Armor 与其他服务集成 Google Cloud ,则此项相关

输入尺码体系限制

下表指定了输入文件或文本大小的系统限制。Model Armor 会跳过超出此限制的文件或文本。

系统限制
所有受支持的文件和文本 4 MB

token 系统限制

Model Armor 具有不同的 token 系统限制, 具体取决于特定的过滤条件。

过滤 系统限制
提示注入和越狱检测 10,000
Responsible AI 10,000
儿童性虐待内容 10,000
Sensitive Data Protection 130,000

如果提示或回答超出 token 限制,Sensitive Data Protection 过滤条件会返回 EXECUTION_SKIPPED。如果提示或回答超出 token 限制,所有其他过滤条件在发现前 1 万个 token 内包含恶意内容时返回 MATCH_FOUND,在前 1 万个 token 中未发现恶意内容时返回 EXECUTION_SKIPPED

获取配额和系统限制指标名称

配额和系统限制有两种类型的名称:显示名称和指标名称。显示名称包含空格和大写字母,更便于人类阅读。指标名称更可能是小写形式,并使用下划线而非空格作为分隔符;确切的格式取决于服务。

以下说明介绍了如何使用 Google Cloud 控制台或 gcloud CLI 获取配额和系统 限制的指标名称。

控制台

  1. 在 Google Cloud 控制台中,依次转到 “IAM 和管理”> “配额和系统限制” 页面:

    进入“配额和系统限制”

    本页面的表格会显示具有用量或具有调整值的配额和系统限制,以及其他配额的引用条目。引用条目在名称 列的列表末尾的括号中有“default”字样。例如,SetIAMPolicy requests per minute per region (default) 是配额 SetIamPolicyRequestsPerMinutePerProject 的引用条目。

  2. 如果您没有看到指标 列,请执行以下步骤。

    1. 点击 列显示选项
    2. 选择指标
    3. 点击确定。表格中会显示指标列。

指标列显示指标名称。如需过滤结果,请在 过滤条件旁边的字段中输入属性名称或值。

gcloud

如需使用 gcloud CLI 获取 Google Cloud 服务的指标名称,请运行 quotas info list 命令。如需跳过未列出指标名称的行,请将输出传递给 grep 等命令,并将 metric: 作为搜索字词,或者使用 gcloud CLI --format 标志:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

替换以下内容:

  • PROJECT_ID_OR_NUMBER:项目 ID 或项目编号。
  • SERVICE_NAME:您要查看其配额指标的服务的名称,例如 Compute Engine 的服务名称为 compute.googleapis.com。包含服务名称的 googleapis.com 部分。