配額與系統限制

這份文件列出 Model Armor 適用的配額和系統限制。

  • 「配額」有預設值,但通常可以申請調整。
  • 「系統限制」是固定值,無法變更。

Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。

Cloud Quotas 系統具備以下功能:

如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。

配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。

詳情請參閱「Cloud Quotas 總覽」。

Model Armor API 配額

下表列出 Model Armor API 的配額。

配額
API 查詢 每項專案每分鐘 1,200 次查詢 (QPM)
對 ExternalProcessor 的要求 每項專案每分鐘 600 次查詢 1

每個專案可套用 0 到 1,200 QPM 之間的值。如要申請調整配額,請參閱「要求調整配額」。如果預設配額不敷使用,請與 Cloud Customer Care 聯絡。

如要瞭解 Model Armor 與其他服務整合的配額,請參閱「管理配額」。

1 如果您將 Model Armor 與其他服務整合 Google Cloud ,這項資訊就非常重要

輸入大小系統限制

下表列出輸入檔案或文字的大小系統限制。如果檔案或文字超過這個限制,Model Armor 會略過。

系統限制
所有支援的檔案和文字 4 MB

權杖系統限制

Model Armor 的權杖系統限制會因特定篩選器而異。

篩選器 系統限制
提示詞注入和越獄偵測 10,000
負責任的 AI 技術 10,000
兒少性虐待內容 10,000
Sensitive Data Protection 130,000 個

如果提示或回覆超過權杖限制,Sensitive Data Protection 篩選器會傳回 EXECUTION_SKIPPED。如果提示或回應超過權杖限制,所有其他篩選器會在前 10,000 個權杖中發現惡意內容時傳回 MATCH_FOUND,在前 10,000 個權杖中未發現惡意內容時傳回 EXECUTION_SKIPPED

取得配額和系統限制指標名稱

配額和系統限制有兩種名稱:顯示名稱和指標名稱。顯示名稱包含空格和大小寫,方便使用者閱讀。指標名稱通常會採用小寫格式,並以底線分隔,而非空格;確切格式取決於服務。

以下操作說明將示範如何使用 Google Cloud 控制台或 gcloud CLI,取得配額和系統限制的指標名稱。

控制台

  1. 在 Google Cloud 控制台,依序前往「IAM & Admin」(IAM 與管理) >「Quotas & System Limits」(配額與系統限制) 頁面:

    前往「Quotas & System Limits」(配額與系統限制)

    本頁面的表格會顯示用量或調整過值的配額和系統限制,以及其他配額的參考項目。參考項目在「名稱」欄的結尾,會以半形括號標示「預設」一詞。舉例來說,SetIAMPolicy requests per minute per region (default) 是配額 SetIamPolicyRequestsPerMinutePerProject 的參照項目。

  2. 如果沒有看到「指標」欄,請按照下列步驟操作。

    1. 按一下「資料欄顯示選項」
    2. 選取「指標」
    3. 按一下 [確定]。表格中會顯示「指標」欄。

「指標」欄會顯示指標名稱。如要篩選結果,請在「篩選條件」 旁的欄位中輸入屬性名稱或值。

gcloud

如要使用 gcloud CLI 取得 Google Cloud 服務的指標名稱,請執行 quotas info list 指令。如要略過未列出指標名稱的行,請將輸出內容傳遞至 grep 等指令,並以 metric: 做為搜尋字詞,或使用 gcloud CLI --format 標記:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

更改下列內容:

  • PROJECT_ID_OR_NUMBER:專案 ID 或專案編號。
  • SERVICE_NAME:您要查看配額指標的服務名稱,例如 Compute Engine 的服務名稱為 compute.googleapis.com。請加入服務名稱的 googleapis.com 部分。