這個頁面說明 Cloud Run 的使用配額和限制。
Cloud Run 的資源數量有限。Cloud Run 的配額中包含 API 頻率限制,這類限制會影響您可以呼叫 Cloud Run Admin API 的頻率。
下列項目未設有直接限制:
- 您可以部署的容器映像檔大小。
- Cloud Run 服務提供的並行要求數量。
Cloud Run 的資源上限
如要超出可增加的限制,請要求增加配額。 如要突破無法提高的專案限制,請在其他 Google Cloud 專案或區域中建立新資源。
| 資源 | 範圍 | 說明 | 限制 | 是否可增加 |
|---|---|---|---|---|
| 服務 | 每個專案和區域 | 服務數量上限 | 1000 | 否 |
| 工作 | 每個專案和區域 | 工作數量上限 | 1000 | 否 |
| 工作站集區 | 每個專案和區域 | 工作站集區數量上限 | 1000 | 否 |
| 工作執行作業 | 每個專案和區域 | 執行中的工作執行作業數量上限 | 1000 | 否 |
| 修訂版本 | 每項服務 | 每個服務的修訂版本數量上限。達到上限時,系統會自動依據建立時間順序刪除未提供服務的修訂版本 | 1000 | 否 |
| 修訂版本 | 每個專案和區域 | 提供流量的修訂版本數量上限 | 4000 | 否 |
| 修訂版本標記 | 每個專案和區域 | 修訂版本標記數量上限。超過修訂版本標記限制時,Cloud Run 會對服務執行標記清除作業。如果為服務建立新標記,系統會自動依據建立時間順序刪除未指定流量百分比的標記。 | 2000 | 否 |
| 工作執行作業 | 每項工作 | 已完成工作執行的保留期限。當作業的執行次數達到上限時,系統會自動依據建立時間順序刪除執行作業 | 1,000 | 否 |
| 工作執行作業任務1 | 每次工作執行作業 | 平行執行的工作數量上限 | 視所選區域、CPU 和記憶體設定而定。高容量區域的上限可能較高,近期開放區域的上限可能較低。您可以在「配額與系統限制」控制台頁面中查看配額。 | 是 |
| 工作執行作業任務 | 每次工作執行作業 | 工作逾時值上限 | 168 小時 (7 天),或使用 GPU 時為 1 小時 | 否 |
| 工作執行作業任務 | 每次工作執行作業 | 單一工作中的工作數量上限 | 10,000 | 否 |
| 工作執行作業任務 | 每次工作執行作業 | 工作中的工作重試次數上限 | 10 | 否 |
| 環境變數 | 每項工作或服務 | 每個容器的環境變數數量上限 | 1000 | 否 |
| 指令引數 | 每項工作或服務 | 每個容器的指令引數數量上限 | 1000 | 否 |
| 容器執行個體3 | 每個修訂版本和區域 | 使用直接虛擬私有雲來處理輸出流量時,容器執行個體數量上限 | 100 到 200 個,視所選區域設定而定。 | 是 |
| 容器執行個體 | 每個容器執行個體 | 啟動逾時 (以分鐘為單位) | 4 | 否 |
| 記憶體 | 每個容器執行個體 | 記憶體大小上限 (GiB) | 32 | 否 |
| CPU | 每個容器執行個體 | vCPU 數量上限 | 8 | 否 |
| CPU1 | 每個專案和區域 | 所有執行個體在 1 分鐘內分配到的 CPU 總數上限,以毫 vCPU 為單位。 | 視所選區域而定。高容量區域的上限可能較高,近期開放區域的上限可能較低。 | 是 |
| 記憶體1 | 每個專案和區域 | 在 1 分鐘內,所有執行個體分配到的記憶體總量上限 (以位元組為單位)。 | 視所選區域而定。高容量區域的上限可能較高,近期開放區域的上限可能較低。您可以在「配額與系統限制」控制台頁面中查看配額。 | 是 |
| 不保證區域備援的 GPU 執行個體1、4 | 每個區域每項專案 | 具有 GPU 的容器執行個體數量上限 | 04 | 是 |
| 含可用區備援保證的 GPU 執行個體1、4 | 每個區域每項專案 | 具有 GPU 的容器執行個體數量上限 | 04 | 是 |
| 磁碟 | 每個容器執行個體 | 受限於執行個體記憶體的可寫入記憶體內檔案系統容量上限 (GiB) | 32 | 否 |
| 環境變數 | 每個變數 | 變數長度上限 (Kb) | 32 | 否 |
| 網域對應 | 每個頂層網域每週 | 安全資料傳輸層 (SSL) 憑證數量上限 | 50 | 否 |
| 網域對應 | 每個頂層網域每週 | 重複安全資料傳輸層 (SSL) 憑證數量上限 | 5 | 否 |
| 存取權杖 | 每個容器執行個體每秒 | 產生的不重複存取權杖數量上限 | 50 | 否 |
| 識別權杖 | 每個容器執行個體每秒 | 產生的不重複識別權杖數量上限 | 50 | 否 |
| 已開啟檔案 | 每個容器執行個體 | 可同時開啟的檔案數量上限。對應至 /proc/sys/fs/file-max。 |
25000 | 否 |
1在下列情況中,系統會使用這些區域配額:
工作的平行處理量上限。在指定區域獲得授權後,該區域的所有工作都可達到授權上限。
區域中執行工作執行的容器執行個體總數。
3在下列情況中,系統會使用這個地區配額:
使用直接虛擬私有雲輸出時,這項屬性會控管修訂版本「執行個體數量上限」屬性可選取的最大值。在特定區域獲得配額後,該區域的所有修訂版本都可達到配額上限。
這項屬性會控管使用直接虛擬私有雲輸出流量的工作平行處理量上限。在特定區域獲得授權後,該區域的所有工作都可以達到授權上限。
4 建立使用 L4 GPU 服務的新專案時,系統會自動授予 3 個 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion。您也可以要求 NvidiaL4GpuAllocPerProjectRegion 或 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion 配額。如果 GPU 使用量尖峰值與配額相差甚遠,Google 可能會調降配額。
Cloud Run 的網路限制
Cloud Run 的要求限制
| 說明 | 限制 | 附註 |
|---|---|---|
| 每個執行個體的並行要求數量上限 | 1000 | |
| 每個 HTTP/2 用戶端連線的並行串流數量上限 | 100 | |
| 每個要求的逾時前等待時間上限 | 60 分鐘 | |
| HTTP/1 要求大小上限 | 如果使用 HTTP/1 伺服器,則為 32 MiB。如果使用 HTTP/2 伺服器,則沒有限制。 | |
| HTTP/1 回應大小上限 | 如未使用 Transfer-Encoding: chunked 或串流機制,則為 32 MiB |
|
| 每個執行個體在每種輸出類型 (網際網路或 VPC) 的公開連線數量上限 | 50000 | 不適用於直接虛擬私有雲輸出流量。 |
| 每個執行個體每秒的傳出連線數 | 700 | 不適用於傳送至虛擬私有雲網路的直接虛擬私有雲輸出流量,這類流量沒有限制。 |
| 每個執行個體每分鐘的傳出連線數 | 5000 | 不適用於傳送至虛擬私有雲網路的直接虛擬私有雲輸出流量,這類流量沒有限制。 |
| 每個執行個體每秒的傳出 DNS 解析次數 | 1000 | |
| 每個執行個體每秒傳送至 HTTP/1 容器連接埠的傳入要求數 | 800 | 不適用於 HTTP/2 容器通訊埠。 |
Cloud Run 的頻寬限制
下列頻寬限制適用於 Cloud Run 執行個體:
| 說明 | 限制 | 附註 |
|---|---|---|
| 透過直接虛擬私有雲輸出時,每個執行個體的位元數上限 | 1 Gbps | 透過直接虛擬私有雲輸出功能,將流量輸出至虛擬私有雲網路上的目的地。 |
| 每個執行個體的位元數上限 (不含透過直接虛擬私有雲輸出的位元數) | 600 Mbps | 根據輸入和輸出位元的總和計算,但不包括透過直接虛擬私有雲輸出功能傳送至虛擬私有雲網路目的地的輸出流量。 |
| 每個執行個體的封包傳輸速率總和上限 (不含透過直接虛擬私有雲輸出的流量) | 每秒 64,000 個封包 | 根據輸入和輸出封包的總和計算,但不包括透過直接虛擬私有雲輸出功能傳送至虛擬私有雲網路目的地的輸出封包。 |
如果達到任一上限,Cloud Run 執行個體的頻寬就會受到限制。
Cloud Run Admin API 頻率限制
下列頻率限制適用於 Cloud Run Admin API,但不適用於傳送至已部署 Cloud Run 服務的要求。
| 配額 | 說明 | 限制 | 是否可增加 | 範圍 |
|---|---|---|---|---|
| Cloud Run Admin API 讀取要求 | 每個區域每 60 秒的「API」讀取作業數。這「不」是傳送至 Cloud Run 服務的讀取要求數 (無限制)。 | 每 60 秒 3,000 次 | 是 | 每個專案和區域 |
| Cloud Run Admin API 寫入要求 | 每個區域每 60 秒的「API」寫入作業數。這「並非」傳送至 Cloud Run 服務的寫入要求數,這類寫入要求沒有數量限制。 | 每 60 秒 180 次 | 是 | 每個專案和區域 |
| 工作執行 | 每個區域每 60 秒可執行的工作次數上限。 | 每 60 秒 180 次 | 是 | 每個專案和區域 |
如何提高配額
Cloud Quotas 的調整要求可能需要經過審查。如果配額調整要求需要審查,我們會發送電子郵件通知,確認已收到您的要求。如需進一步協助,請回覆該電子郵件。要求經審查後,我們會傳送電子郵件,通知您要求是否獲准。您可以透過 Google Cloud 控制台、Cloud Quotas API 或 Google Cloud CLI 申請調整配額。以下說明如何使用 Google Cloud 控制台或向 Cloud Quotas API 發出 REST 要求,申請新的配額值。
控制台
如要申請調整配額,請按照下列步驟操作:
在 Google Cloud 控制台,依序前往「IAM & Admin」(IAM 與管理) >「配額與系統限制」頁面:
如果系統提示選取專案,請選取要調整的專案。找出要調整的配額,然後開啟「配額變更」對話方塊:
表格未列出的配額:
- 在「Filter」(篩選器) 搜尋框中搜尋配額。請勿指定區域或地帶 (如適用),因為配額如果沒有使用或調整值,就不會顯示在表格中。
- 在表格中找出配額的任何項目。可以是預設項目,也可以是任何有記錄的項目,不論區域或時區。
- 在項目所在資料列中,依序點選 「更多動作」>「設定其他區域/可用區」。
- 選取要調整的區域或時區。按一下 [編輯]。
所有其他配額:
- 在「Filter」(篩選器) 搜尋框中搜尋配額。
- 在項目的行中,選取配額的核取方塊。
- 按一下「編輯」。
「Quota changes」(配額變更) 對話方塊隨即顯示。
如果「New value」(新值) 欄位上方顯示「Apply for higher quota」(申請更多配額) 連結,且您想將配額值提高到超出畫面上顯示的數字,請點選該連結。填寫表單並提交,其餘步驟可略過。否則請繼續按照本指南操作。
在「New value」(新值) 欄位中,輸入想要增加的配額值。如果出現「Request description」(要求說明) 欄位,請輸入說明。接著點選「完成」。
- 如果核取方塊顯示「我瞭解這項要求將移除任何覆寫設定」,表示您的配額值已設為低於預設值。將配額值調整為預設值或更高,會移除覆寫值。 如要繼續,請勾選核取方塊。進一步瞭解配額覆寫設定。
如果畫面上出現「Next」(下一步) 按鈕,請按一下「Next」(下一步),然後在隨後的畫面中填入聯絡資料。
點選「Submit request」(提交要求)。
如果發現無法透過控制台提出調整要求,請向 Cloud Customer Care 申請提高配額。
如要進一步瞭解配額提高程序的運作方式,請參閱「關於配額調整」的相關說明。
批次傳送配額調整要求
您可以選取每個要納入的配額旁邊的核取方塊,以便批次傳送調整配額的要求。不過,批次傳送要求可能會增加 Google Cloud 審查要求所需的時間。
為縮短審查時間,請依產品和區域將配額調整要求分組。舉例來說,如果您想申請調整網路和 Compute Engine VM 配額,請分別建立網路配額和 Compute Engine VM 配額的要求。
REST
如要透過 Cloud Quotas API 申請調整配額,請使用下列程式碼範例。在可編輯的預留位置填入您的值。如要瞭解預留位置欄位,請參閱程式碼範例後方的說明。
POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID { "service": "SERVICE_ID", "quotaId": "QUOTA_ID", "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" }, "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" }, "justification": "JUSTIFICATION", "contactEmail": "EMAIL" }
更改下列內容:
PROJECT_NUMBER:您的 Google Cloud 專案編號。您可以在 Google Cloud 控制台的「Welcome」(歡迎)頁面找到專案編號,也可以執行下列 gcloud CLI 指令:PROJECT=$(gcloud info --format='value(config.project)') gcloud projects describe ${PROJECT} --format="value(projectNumber)"
QUOTA_PREFERENCE_ID:要更新的配額偏好設定 ID。QUOTA_ID:要更新的配額 ID。SERVICE_ID:要調整配額的 Google Cloud ID。通常採用SERVICE_NAME.googleapis.com 格式。舉例來說,Compute Engine 服務名稱為compute.googleapis.com。DIMENSION_1:要調整的維度類型,例如region或zone。您可以加入多個維度。請在每個維度的值後面加上半形逗號,例如VALUE_1,藉此分隔維度。如要調整配額的所有維度,請省略這一行。VALUE_1:前一個維度的值。舉例來說,如果前一個維度是region,請輸入區域,例如us-central1。JUSTIFICATION:這項要求的原因。EMAIL:如果 Google Cloud 需要更多資訊才能做出決定,並核發額外配額,這個電子郵件地址可用於聯絡。
要求範例
以下範例是針對 Compute Engine 配額 PUS-PER-GPU-FAMILY-per-project-region 提出配額值增加要求。這項要求會為 us-central1 地區的 GPU 系列 NVIDIA_H100 機器申請 100 的配額值。
POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
"service": "compute.googleapis.com",
"quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
"quotaConfig": { "preferredValue": 100 },
"dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
"justification": "My justification.",
"contactEmail": "222larabrown@gmail.com"
}