Pelajari cara menetapkan jumlah maksimum permintaan yang dapat diproses secara bersamaan oleh instance container tertentu dalam penayangan Knative. Pelajari serentak lebih lanjut.
Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi selanjutnya juga akan otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.
Anda dapat mengonfigurasi setelan serentak menggunakan konsol Google Cloud , atau Google Cloud CLI saat men-deploy layanan baru atau memperbarui layanan yang ada dan men-deploy revisi:
Konsol
Buka Knative serving di konsol Google Cloud :
Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan tersebut, lalu klik Edit & Deploy Revisi Baru.
Di bagian Setelan lanjutan, klik Penampung.
Tetapkan nilai konkurensi yang diinginkan dalam kotak teks Permintaan maksimum per container.
Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Konfigurasi cara layanan ini dipicu, pilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.
Klik Create untuk men-deploy image ke layanan Knative dan tunggu hingga deployment selesai.
Command line
Untuk layanan yang sudah ada, tetapkan jumlah maksimum permintaan serentak dengan menjalankan perintah
gcloud run services update
dengan parameter--concurrency
:gcloud run services update SERVICE --concurrency CONCURRENCY
Ganti:
- SERVICE dengan nama layanan Anda.
- CONCURRENCY dengan jumlah maksimum permintaan serentak per instance container. Tentukan
default
untuk menghapus setelan konkurensi:--concurrency default
.
Untuk layanan baru, tetapkan jumlah maksimum permintaan serentak dengan menjalankan perintah
gcloud run deploy
dengan parameter--concurrency
:gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
Ganti:
- SERVICE dengan nama layanan Anda.
- IMAGE_URL dengan referensi ke image container,
misalnya,
gcr.io/cloudrun/hello
. - CONCURRENCY dengan jumlah maksimum permintaan serentak per instance container. Tentukan
default
untuk menghapus setelan konkurensi:--concurrency default
.
YAML
Anda dapat mendownload konfigurasi layanan yang ada ke dalam
file YAML dengan perintah gcloud run services describe
menggunakan tanda
--format=export
.
Kemudian, Anda dapat mengubah file YAML tersebut dan men-deploy
perubahan tersebut dengan perintah gcloud run services replace
.
Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.
Download konfigurasi layanan Anda ke file bernama
service.yaml
di ruang kerja lokal:gcloud run services describe SERVICE --format export > service.yaml
Ganti SERVICE dengan nama layanan Knative serving Anda.
Di file lokal Anda, perbarui atribut
containerConcurrency
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
Ganti:
- SERVICE dengan nama layanan Knative serving Anda
- CONCURRENCY dengan jumlah maksimum permintaan serentak per instance container. Tentukan
default
untuk menghapus setelan serentak:--concurrency default
.
Ganti layanan dengan konfigurasi barunya menggunakan perintah berikut:
gcloud run services replace service.yaml