這份文件列出 Model Armor 適用的配額和系統限制。
- 「配額」有預設值,但通常可以申請調整。
- 「系統限制」是固定值,無法變更。
Google Cloud 使用配額來確保公平性,並減少資源使用量和可用性出現劇烈波動的情況。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量,且適用多種資源類型,包括軟硬體和網路元件。舉例來說,配額可能會限制能向特定服務發出的 API 呼叫次數、專案可同時使用的負載平衡器數量,或是可建立的專案數量。配額機制可防止服務過載,保障Google Cloud 使用者社群的權益,同時也有助於您管理自己的 Google Cloud 資源。
Cloud Quotas 系統具備以下功能:
如果嘗試使用的資源量超過配額限制,系統通常會阻擋該資源的存取活動,您所執行的工作就會失敗。
配額的計算通常是以 Google Cloud 專案為基準。在某個專案中使用資源,不會影響另一個專案的可用配額。在同一個 Google Cloud 專案內,所有應用程式和 IP 位址會共用配額。
詳情請參閱「Cloud Quotas 總覽」。
API 查詢配額
您可以在 Google Cloud 控制台中提高這項配額,與其他 Google Cloud 服務類似。
| 配額 | 值 |
|---|---|
| API 查詢 | 每項專案每分鐘 1,200 次查詢 (QPM) |
輸入大小系統限制
下表說明輸入檔案或文字的大小系統限制。
| 系統限制 | 值 |
|---|---|
| 所有支援的檔案和文字 | 4 MB |
權杖系統限制
Model Armor 的權杖系統限制會因特定篩選器而異。
| 篩選器 | 系統限制 |
|---|---|
| 提示詞注入和越獄偵測 | 10,000 |
| 負責任的 AI 技術 | 10,000 |
| 兒少性虐待內容 | 10,000 |
| Sensitive Data Protection | 130,000 個 |
如果提示或回覆超過權杖限制,Sensitive Data Protection 篩選器會傳回 EXECUTION_SKIPPED。如果提示或回應超過詞元限制,所有其他篩選器都會傳回 MATCH_FOUND (如果前 10,000 個詞元中含有惡意內容) 或 EXECUTION_SKIPPED (如果前 10,000 個詞元中不含惡意內容)。
取得配額和系統限制指標名稱
配額和系統限制有兩種名稱:顯示名稱和指標名稱。顯示名稱包含空格和大小寫,方便使用者閱讀。指標名稱通常會採用小寫格式,並以底線分隔,而非空格;確切格式取決於服務。
以下操作說明將示範如何使用 Google Cloud 控制台或 gcloud CLI,取得配額和系統限制的指標名稱。
控制台
在 Google Cloud 控制台,依序前往「IAM & Admin」(IAM 與管理) >「Quotas & System Limits」(配額與系統限制) 頁面:
本頁面的表格會顯示用量或調整過值的配額和系統限制,以及其他配額的參考項目。參考項目在「名稱」欄的結尾,會以半形括號標示「預設」一詞。舉例來說,
SetIAMPolicy requests per minute per region (default)是配額SetIamPolicyRequestsPerMinutePerProject的參照項目。如果沒有看到「指標」欄,請按照下列步驟操作。
- 按一下「資料欄顯示選項」。
- 選取「指標」。
- 按一下 [確定]。表格中會顯示「指標」欄。
「指標」欄會顯示指標名稱。如要篩選結果,請在「篩選」旁的欄位中輸入屬性名稱或值。
gcloud
如要使用 gcloud CLI 取得 Google Cloud 服務的指標名稱,請執行 quotas info list 指令。如要略過未列出指標名稱的行,請將輸出內容傳遞至 grep 等指令,並以 metric: 做為搜尋字詞,或使用 gcloud CLI --format 標記:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
更改下列內容:
PROJECT_ID_OR_NUMBER:專案 ID 或專案編號。SERVICE_NAME:您要查看配額指標的服務名稱,例如 Compute Engine 的服務名稱為compute.googleapis.com。請加入服務名稱的googleapis.com部分。
要求調整配額
如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。