Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

worker 集區的 GPU 支援

本頁面說明 Cloud Run 工作站集區的 GPU 設定。 Google 提供 NVIDIA RTX PRO 6000 Blackwell GPU，具有 96 GB 的 GPU 記憶體 (VRAM)；以及 NVIDIA L4 GPU，具有 24 GB 的 GPU 記憶體 (VRAM)，這與執行個體記憶體不同。

Cloud Run GPU 為全代管服務，不需要額外的驅動程式或程式庫。GPU 功能提供隨選可用性，不需要預留，與 Cloud Run 中的隨選 CPU 和隨選記憶體運作方式類似。

附加 NVIDIA RTX PRO 6000 Blackwell GPU 或 L4 GPU 並預先安裝驅動程式的 Cloud Run 執行個體，大約會在 5 秒內啟動，屆時容器中執行的程序即可開始使用 GPU。

每個 Cloud Run 執行個體可以設定一個 GPU。如果您使用 Sidecar 容器，請注意 GPU 只能附加至一個容器。

支援的 GPU 類型

Cloud Run 支援兩種 GPU：

NVIDIA RTX PRO 6000 Blackwell GPU，搭配目前的 NVIDIA 驅動程式版本：580.x.x (13.0)。如要使用 NVIDIA RTX PRO 6000 Blackwell GPU，最少須使用 20 個 CPU 和 80 GiB 記憶體。
L4 GPU，搭配目前的 NVIDIA 驅動程式版本：535.x.x (12.2)。如要使用 L4 GPU，最少須使用 4 個 CPU 和 16 GiB 記憶體。

支援的地區

NVIDIA RTX PRO 6000 Blackwell GPU 支援下列地區：

asia-southeast1 (新加坡)。
asia-south2 (印度德里)。
europe-west4 (荷蘭) 二氧化碳排放量低
us-central1 (愛荷華州) 二氧化碳排放量低

L4 GPU 支援下列地區：

asia-southeast1 (新加坡)
asia-south1 (孟買) 。這個區域僅限受邀者使用。如有興趣，請與 Google 帳戶團隊聯絡。
europe-west1 (比利時) 二氧化碳排放量低
europe-west4 (荷蘭) 二氧化碳排放量低
us-central1 (愛荷華州) 低二氧化碳₂ 。如要在這個區域進一步擴充資源，可能需要申請增加配額。如果您對這個區域有興趣，請與 Google 帳戶團隊聯絡。
us-east4 (北維吉尼亞州) 。如要在這個區域進一步擴充資源，可能需要申請提高配額。如有意使用這個區域，請與 Google 帳戶團隊聯絡。

價格影響

如需 GPU 定價詳情，請參閱「Cloud Run 定價」。請注意下列規定和考量事項：

GPU 可用區備援機制和非可用區備援機制的費用不同。如需 GPU 定價詳情，請參閱「Cloud Run 定價」。
GPU 工作站集區無法自動調度資源。即使 GPU 未執行任何程序，只要工作站集區 GPU 執行個體正在執行，您仍須支付 GPU 費用。
工作站集區的 CPU 和記憶體計費方式與服務和作業不同。不過，GPU SKU 的價格與服務和工作相同。
資源的 CPU 和記憶體設定。
系統會針對執行個體生命週期的整個期間收取 GPU 費用。

GPU 可用區備援機制選項

根據預設，Cloud Run 會在單一區域內的多個可用區部署工作站集區。這項架構具有固有的韌性：如果某個可用區發生服務中斷情形，Cloud Run 會自動將流量從受影響的可用區，重新導向至同一區域內運作正常的可用區。

使用 GPU 資源時，請注意 GPU 資源有特定的容量限制。在可用區服務中斷期間，GPU 工作負載的標準容錯移轉機制會依賴其餘正常可用區中是否有足夠的未使用 GPU 容量。由於 GPU 的限制性質，這類容量可能不一定可用。

如要提高 GPU 加速工作站集區在可用區服務中斷期間的可用性，您可以專為 GPU 設定可用區備援機制：

啟用可用區備援機制 (預設)：Cloud Run 會在多個可用區為工作站集區預留 GPU 運算資源。這樣一來，工作站集區就能處理從受影響可用區重新導向的流量，在可用區發生故障時提供更高的可靠性，不過每秒 GPU 的費用較高。
關閉可用區備援機制：Cloud Run 會盡力為 GPU 工作負載執行容錯移轉。只有在當時有足夠的 GPU 運算資源時，流量才會轉送至其他可用區。這個選項無法保證容錯移轉情境的預留運算資源，但每秒 GPU 的費用較低。

服務水準協議

Cloud Run GPU 的服務等級協議 (SLA) 取決於工作站集區是否使用可用區備援或非可用區備援選項。詳情請參閱 SLA 頁面。

申請提高配額

系統會以毫 GPU 為單位，授予 Cloud Run nvidia-rtx-pro-6000 GPU 配額。專案首次在某個區域使用 nvidia-rtx-pro-6000 GPU 時，系統會在建立第一個部署作業時，自動授予 3,000 milliGPU 配額 (區域備援關閉)。這相當於 3 個 GPU。首次在區域中使用 Cloud Run nvidia-l4 GPU 的專案，在建立第一個部署作業時，系統會自動授予 3 個 GPU 配額 (關閉可用區備援)。

如需更多 Cloud Run GPU，請為 Cloud Run 工作站集區申請提高配額。請使用下列按鈕提供的連結，申請所需配額。

需要配額	配額連結
NVIDIA RTX PRO 6000 Blackwell GPU，並關閉區域備援功能 (價格較低)	申請無可用區備援的 GPU 配額
NVIDIA RTX PRO 6000 Blackwell GPU，並開啟可用區備援機制 (價格較高)	申請可用區備援 GPU 配額
關閉可用區備援的 L4 GPU (價格較低)	申請不具備可用區備援功能的 GPU 配額
啟用可用區備援機制的 L4 GPU (價格較高)	申請可用區備援 GPU 配額

如要進一步瞭解如何要求增加配額，請參閱「如何增加配額」。

事前準備

在 Cloud Run 中使用 GPU 時，請注意下列需求和限制：

登入 Google Cloud 帳戶。如果您是 Google Cloud新手，歡迎建立帳戶，親自評估產品在實際工作環境中的成效。新客戶還能獲得價值 $300 美元的免費抵免額，可用於執行、測試及部署工作負載。

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

啟用 Cloud Run API。
啟用 API 時所需的角色
如要啟用 API，您需要具備服務使用情形管理員 IAM 角色 (roles/serviceusage.serviceUsageAdmin)，其中包含 serviceusage.services.enable 權限。瞭解如何授予角色。
啟用 API

申請所需配額。
請參閱「GPU 最佳做法：搭載 GPU 的 Cloud Run 工作站集區」，瞭解如何建構容器映像檔及載入大型模型。
請確認 Cloud Run 工作站集區具有下列設定：

將帳單設定變更為以執行個體為依據。請注意，設為以執行個體計費的工作站集區仍可縮減至零。
如要使用 NVIDIA RTX PRO 6000 Blackwell GPU，請設定至少 20 個 CPU 和至少 80 GiB 的記憶體。
如要使用 L4 GPU，請為工作站集區設定至少 4 個 CPU (建議 8 個)，以及至少 16 GiB 的記憶體 (建議 32 GiB)。
判斷並設定 GPU 使用量的最佳並行上限。

必要的角色

如要取得設定及部署 Cloud Run worker 集區所需的權限，請要求管理員授予您 worker 集區的下列 IAM 角色：

Cloud Run 開發人員 (roles/run.developer) - Cloud Run worker 集區
服務帳戶使用者 (roles/iam.serviceAccountUser) - 服務身分

如需與 Cloud Run 相關聯的 IAM 角色和權限清單，請參閱「Cloud Run IAM 角色」和「Cloud Run IAM 權限」。如果 Cloud Run 工作站集區與Google Cloud API (例如 Cloud Client Libraries) 介接，請參閱服務身分設定指南。如要進一步瞭解如何授予角色，請參閱「部署權限」和「管理存取權」。

設定搭載 GPU 的 Cloud Run worker 集區

變更任何設定都會建立新的修訂版本。除非您明確做出更新，改變這項設定，否則後續的修訂版本也會自動取得這個設定。

您可以使用 Google Cloud 控制台、Google Cloud CLI 或 YAML 設定 GPU。

控制台

前往 Google Cloud 控制台的 Cloud Run：

前往 Cloud Run。
從 Cloud Run 導覽選單選取「工作站集區」，然後按一下「部署容器」，設定新的工作站集區。如要設定現有的工作站集區，請按一下該集區，然後按一下「編輯並部署新修訂版本」。
如要設定新的工作站集區，請填寫初始工作站集區設定頁面，然後按一下「Containers, Networking, Security」(容器、網路、安全性)，展開工作站集區設定頁面。
按一下「容器」分頁標籤。
- 請按照「事前準備」中的建議，設定 CPU、記憶體、並行、執行環境和啟動探查
- 勾選「GPU」核取方塊，然後從「GPU type」(GPU 類型) 選單選取 GPU 類型，並從「Number of GPUs」(GPU 數量) 選單選取 GPU 數量。
- 預設會開啟可用區備援機制。如要變更目前設定，請選取 GPU 核取方塊，顯示「GPU 備援機制」選項。
按一下 [Create] (建立) 或 [Deploy] (部署)。

gcloud

如要建立啟用 GPU 的工作站集區，請使用 gcloud run worker-pools deploy 指令：

  gcloud run worker-pools deploy WORKER_POOL \
    --image IMAGE_URL \
    --gpu 1

更改下列內容：

WORKER_POOL：Cloud Run worker 集區的名稱。
IMAGE_URL：包含工作站集區的容器映像檔參照，例如 us-docker.pkg.dev/cloudrun/container/worker-pool:latest。

如要更新工作站集區的 GPU 設定，請使用 gcloud run worker-pools update 指令：

  gcloud run worker-pools update WORKER_POOL \
    --image IMAGE_URL \
    --cpu CPU \
    --memory MEMORY \
    --gpu GPU_NUMBER \
    --gpu-type GPU_TYPE \
    --GPU_ZONAL_REDUNDANCY

更改下列內容：

WORKER_POOL：Cloud Run worker 集區的名稱。
IMAGE_URL：包含工作站集區的容器映像檔參照，例如 us-docker.pkg.dev/cloudrun/container/worker-pool:latest。
：CPU 數量。如為 NVIDIA RTX PRO 6000 Blackwell GPU，您必須指定至少 20 個 CPU。如為 NVIDIA L4 GPU，您必須指定至少 4 個 CPU。CPU
：記憶體容量。如果是 NVIDIA RTX PRO 6000 Blackwell GPU，您必須指定至少 80Gi (80 GiB)。如果是 NVIDIA L4 GPU，您必須指定至少 16Gi (16 GiB)。MEMORY
GPU_NUMBER：值 1 (一)。如果未指定這個值，但存在 GPU_TYPE，則預設為 1。
GPU_TYPE：GPU 類型。NVIDIA RTX PRO 6000 Blackwell GPU，請輸入 nvidia-rtx-pro-6000。如為 L4 GPU，請輸入值 nvidia-l4 (nvidia-L4 小寫 L，而非數值十四)。
GPU_ZONAL_REDUNDANCY：no-gpu-zonal-redundancy 可關閉區域備援，gpu-zonal-redundancy 則可開啟區域備援。

YAML

如要建立新的工作站集區，請略過這個步驟。如要更新現有工作站集區，請下載其 YAML 設定：
```
gcloud run worker-pools describe WORKER_POOL --format export > workerpool.yaml
```
更新 nvidia.com/gpu: 屬性和 nodeSelector: run.googleapis.com/accelerator:：
```
apiVersion: run.googleapis.com/v1
kind: WorkerPool
metadata:
  name: WORKER_POOL
spec:
  template:
    metadata:
      annotations:
        run.googleapis.com/gpu-zonal-redundancy-disabled: 'GPU_ZONAL_REDUNDANCY'
    spec:
      containers:
      - image: IMAGE_URL
        resources:
          limits:
            cpu: 'CPU'
            memory: 'MEMORY'
            nvidia.com/gpu: '1'
      nodeSelector:
        run.googleapis.com/accelerator: GPU_TYPE
```
更改下列內容：
- WORKER_POOL：Cloud Run worker 集區的名稱。
- IMAGE_URL：包含工作站集區的容器映像檔參照，例如 us-docker.pkg.dev/cloudrun/container/worker-pool:latest。
- ：CPU 數量。如要使用 NVIDIA RTX PRO 6000 Blackwell GPU，至少須指定 20 個 CPU。如要使用 L4 GPU，至少須指定 4 個 CPU。CPU
- ：記憶體容量。如果是 NVIDIA RTX PRO 6000 Blackwell GPU，至少須指定 80Gi (80 GiB)。如果是 L4 GPU，至少須指定 16Gi (16 GiB)。MEMORY
- GPU_TYPE：GPU 類型。如要使用 NVIDIA RTX PRO 6000 Blackwell GPU，請輸入 nvidia-rtx-pro-6000。如果是 L4 GPU，請輸入 nvidia-l4 值 (nvidia-L4 小寫 L，而非數值 14)。
- GPU_ZONAL_REDUNDANCY：false 可開啟 GPU 可用區備援機制，true 則可關閉。

使用下列指令建立或更新工作站集區：

gcloud run worker-pools replace workerpool.yaml

Terraform

如要瞭解如何套用或移除 Terraform 設定，請參閱「基本 Terraform 指令」。

resource "google_cloud_run_v2_worker_pool" "default" {
  provider = google-beta
  name     = "WORKER_POOL"
  location = "REGION"

  template {
    gpu_zonal_redundancy_disabled = "GPU_ZONAL_REDUNDANCY"
    containers {
      image = "IMAGE_URL"
      resources {
        limits = {
          "cpu" = "CPU"
          "memory" = "MEMORY"
          "nvidia.com/gpu" = "1"
        }
      }
    }
    node_selector {
      accelerator = "GPU_TYPE"
    }
  }
}

更改下列內容：

WORKER_POOL：Cloud Run worker 集區的名稱。
GPU_ZONAL_REDUNDANCY：false 可開啟 GPU 可用區備援機制，true 則可關閉。
IMAGE_URL：包含工作站集區的容器映像檔參照，例如 us-docker.pkg.dev/cloudrun/container/worker-pool:latest。
：CPU 數量。如為 NVIDIA RTX PRO 6000 Blackwell GPU，至少須指定 20 個 CPU。如為 NVIDIA L4 GPU，至少須指定 4 個 CPU。CPU
：記憶體容量。如果是 NVIDIA RTX PRO 6000 Blackwell GPU，您必須指定至少 80Gi (80 GiB)。如果是 NVIDIA L4 GPU，您必須指定至少 16Gi (16 GiB)。MEMORY
GPU_TYPE：GPU 類型。NVIDIA RTX PRO 6000 Blackwell GPU，請輸入 nvidia-rtx-pro-6000。如為 L4 GPU，請輸入值 nvidia-l4 (nvidia-L4 小寫 L，而非數值十四)。

設定工作目錄

工作目錄是容器執行指令和引數的位置。部署新服務或現有服務時，您可以為容器程序指定自訂工作目錄。如未指定，系統會使用容器映像檔的預設工作目錄。如要將這個欄位重設為預設值，請傳遞空字串或移除該欄位。

例如：

YAML

如要建立新的工作站集區，請略過這個步驟。如要更新現有工作站集區，請下載其 YAML 設定：
```
gcloud run worker-pools describe WORKER_POOL --format export > workerpool.yaml
```
更新 workingDir: 屬性：
```
apiVersion: run.googleapis.com/v1
kind: WorkerPool
metadata:
  name: WORKER_POOL
spec:
  template:
    metadata:
      annotations:
        run.googleapis.com/launch-stage: BETA
        run.googleapis.com/gpu-zonal-redundancy-disabled: 'GPU_ZONAL_REDUNDANCY'
    spec:
      containers:
      - image: IMAGE_URL
        resources:
          limits:
            cpu: 'CPU'
            memory: 'MEMORY'
            nvidia.com/gpu: '1'
        workingDir: WORKING_DIR
      nodeSelector:
        run.googleapis.com/accelerator: GPU_TYPE
```
更改下列內容：
- WORKER_POOL：Cloud Run worker 集區的名稱。
- IMAGE_URL：包含工作站集區的容器映像檔參照，例如 us-docker.pkg.dev/cloudrun/container/worker-pool:latest。
- CPU：CPU 數量。如要使用 NVIDIA RTX PRO 6000 Blackwell GPU，您必須至少指定 20 個 CPU。如果是 L4 GPU，則必須指定至少 4 個 CPU。
- ：記憶體容量。如果是 NVIDIA RTX PRO 6000 Blackwell GPU，至少須指定 80Gi (80 GiB)。如果是 L4 GPU，至少須指定 16Gi (16 GiB)。MEMORY
- WORKING_DIR：(選用) 容器的工作目錄。如未指定，系統會使用容器執行階段的預設值，這可能是在容器映像檔中設定。
- GPU_TYPE：GPU 類型。如要使用 NVIDIA RTX PRO 6000 Blackwell GPU，請輸入 nvidia-rtx-pro-6000。如果是 L4 GPU，請輸入 nvidia-l4 值 (nvidia-L4 小寫 L，而非數值 14)。
- GPU_ZONAL_REDUNDANCY：false 可開啟 GPU 可用區備援機制，true 則可關閉。

使用下列指令建立或更新工作站集區：

gcloud run worker-pools replace workerpool.yaml

Terraform

在 Terraform 設定的資源中新增下列項目：
google_cloud_run_v2_worker_pool

resource "google_cloud_run_v2_worker_pool" "default" {
  provider = google-beta
  name     = "WORKER_POOL"
  location = "REGION"

  template {
    gpu_zonal_redundancy_disabled = "GPU_ZONAL_REDUNDANCY"
    containers {
      image = "IMAGE_URL"
      resources {
        limits = {
          "cpu" = "CPU"
          "memory" = "MEMORY"
          "nvidia.com/gpu" = "1"
        }
        working_dir = WORKING_DIR
      }
    }
    node_selector {
      accelerator = "GPU_TYPE"
    }
  }
}

更改下列內容：

WORKER_POOL：Cloud Run worker 集區的名稱。
GPU_ZONAL_REDUNDANCY：false 可開啟 GPU 可用區備援機制，true 則可關閉。
IMAGE_URL：包含工作站集區的容器映像檔參照，例如 us-docker.pkg.dev/cloudrun/container/worker-pool:latest。
：CPU 數量。如為 NVIDIA RTX PRO 6000 Blackwell GPU，至少須指定 20 個 CPU。如為 NVIDIA L4 GPU，至少須指定 4 個 CPU。CPU
：記憶體容量。如果是 NVIDIA RTX PRO 6000 Blackwell GPU，您必須指定至少 80Gi (80 GiB)。如果是 NVIDIA L4 GPU，您必須指定至少 16Gi (16 GiB)。MEMORY
WORKING_DIR：(選用) 容器的工作目錄。如未指定，系統會使用容器執行階段的預設值，這可能是在容器映像檔中設定。
GPU_TYPE：GPU 類型。如要使用 NVIDIA RTX PRO 6000 Blackwell GPU，請輸入 nvidia-rtx-pro-6000。如果是 L4 GPU，請輸入 nvidia-l4 值 (nvidia-L4，小寫 L，不是數字 14)。

查看 GPU 設定

如要查看 Cloud Run 工作人員集區的目前 GPU 設定：

控制台

前往 Google Cloud 控制台的 Cloud Run 工作人員集區頁面：

前往 Cloud Run worker 集區
按一下所需的工作站集區，開啟「工作站集區詳細資料」頁面。
按一下「編輯及部署新的修訂版本」。
在設定詳細資料中找出 GPU 設定。

gcloud

使用下列指令：

gcloud run worker-pools describe WORKER_POOL

在傳回的設定中找出 GPU 設定。

移除 GPU

您可以使用 Google Cloud 控制台、Google Cloud CLI 或 YAML 移除 GPU。

控制台

前往 Google Cloud 控制台的 Cloud Run：

前往 Cloud Run。
從 Cloud Run 導覽選單選取「工作站集區」，然後按一下「部署容器」，設定新的工作站集區。如要設定現有 worker 集區，請按一下該 worker 集區，然後按一下「Edit and deploy new revision」(編輯並部署新修訂版本)。
如要設定新的工作站集區，請填寫初始工作站集區設定頁面，然後按一下「Containers, Networking, Security」(容器、網路、安全性)，展開工作站集區設定頁面。
按一下「容器」分頁標籤。

取消勾選 GPU 核取方塊。

按一下 [Create] (建立) 或 [Deploy] (部署)。

gcloud

如要移除 GPU，請將 GPU 數量設為 0：

  gcloud run worker-pools update WORKER_POOL --gpu 0

將 WORKER_POOL 替換為 Cloud Run 工作站集區的名稱。

YAML

如要建立新的工作站集區，請略過這個步驟。如要更新現有工作站集區，請下載其 YAML 設定：
```
gcloud run worker-pools describe WORKER_POOL --format export > workerpool.yaml
```
刪除 nvidia.com/gpu: 和 nodeSelector: run.googleapis.com/accelerator: GPU_TYPE 行。

使用下列指令建立或更新工作站集區：

gcloud run worker-pools replace workerpool.yaml

驅動程式庫

根據預設，所有 NVIDIA RTX PRO 6000 Blackwell GPU 和 NVIDIA L4 GPU 驅動程式程式庫都會掛接在 /usr/local/nvidia/lib64 下方。Cloud Run 會自動將這個路徑附加至含有 GPU 的容器的 LD_LIBRARY_PATH 環境變數 (即 ${LD_LIBRARY_PATH}:/usr/local/nvidia/lib64)。這樣一來，動態連結器就能找到 NVIDIA 驅動程式程式庫。連結器會依您在 LD_LIBRARY_PATH 環境變數中列出的順序搜尋及解析路徑。您在這個變數中指定的任何值，都會優先於預設的 Cloud Run 驅動程式程式庫路徑 /usr/local/nvidia/lib64。

如要使用 12.2 以上的 CUDA 版本，最簡單的方法是依附於較新的 NVIDIA 基本映像檔，其中已安裝向前相容套件。另一種方法是手動安裝 NVIDIA 向前相容套件，並將這些套件新增至 LD_LIBRARY_PATH。請參閱 NVIDIA 相容性矩陣，判斷哪些 CUDA 版本與提供的 NVIDIA 驅動程式版本向前相容。

worker 集區的 GPU 支援 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

支援的 GPU 類型

支援的地區

價格影響

GPU 可用區備援機制選項

服務水準協議

申請提高配額

事前準備

必要的角色

設定搭載 GPU 的 Cloud Run worker 集區

控制台

gcloud

YAML

Terraform

設定工作目錄

YAML

Terraform

查看 GPU 設定

控制台

gcloud

移除 GPU

控制台

gcloud

YAML

驅動程式庫

worker 集區的 GPU 支援