瞭解如何在 Knative Serving 中,設定特定容器執行個體可同時處理的要求數量上限。進一步瞭解並行。
變更任何設定都會建立新的修訂版本。除非您明確做出更新,改變這項設定,否則後續的修訂版本也會自動取得這個設定。
部署新服務或更新現有服務並部署修訂版本時,可以使用 Google Cloud 控制台或 Google Cloud CLI 設定並行設定:
控制台
前往 Google Cloud 控制台的 Knative Serving:
如要設定要部署的新服務,請按一下「Create Service」(建立服務)。如要設定現有服務,請按一下該服務,然後按一下「編輯及部署新的修訂版本」。
在「進階設定」下方,按一下「容器」。
在「每個容器的要求數量上限」文字方塊中設定所要的並行值。
按一下「下一步」繼續前往下一個部分。
在「設定這項服務的觸發方式」部分,選取要用來叫用服務的連線。
按一下「建立」,將映像檔部署到 Knative serving,然後等待部署作業完成。
指令列
如為現有服務,請執行
gcloud run services update指令搭配--concurrency參數,設定並行要求數量上限:gcloud run services update SERVICE --concurrency CONCURRENCY
更改項目:
- SERVICE 改為您的服務名稱。
- CONCURRENCY 改成每個容器執行個體的並行要求數量上限。指定
default即可清除任何並行設定:--concurrency default。
如為新服務,請執行
gcloud run deploy指令並搭配--concurrency參數,設定並行要求的數量上限:gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
更改項目:
- SERVICE 改為您的服務名稱。
- IMAGE_URL,並參照容器映像檔,例如
gcr.io/cloudrun/hello。 - CONCURRENCY 改成每個容器執行個體的並行要求數量上限。指定
default即可清除任何並行設定:--concurrency default。
YAML
您可以使用 gcloud run services describe 指令,透過 --format=export 旗標將現有服務的設定下載至 YAML 檔案。然後修改該 YAML 檔案,並使用 gcloud run services replace 指令部署這些變更。請務必只修改指定的屬性。
將服務設定下載到本機工作區中名為
service.yaml的檔案:gcloud run services describe SERVICE --format export > service.yaml
將 SERVICE 替換為 Knative serving 服務名稱。
在你的本機檔案中,更新
containerConcurrency屬性:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
更改項目:
- 將 SERVICE 改為 Knative serving 服務名稱
- CONCURRENCY 改成每個容器執行個體的並行要求數量上限。指定
default可清除並行設定:--concurrency default。
使用下列指令,以新設定取代服務:
gcloud run services replace service.yaml