Kuota dan Batas Cloud Run

Halaman ini berisi kuota penggunaan dan batas yang berlaku saat menggunakan Cloud Run.

Jumlah resource pada Cloud Run terbatas. Kuota untuk Cloud Run mencakup batas kapasitas API, yang memengaruhi tingkat panggilan ke Cloud Run Admin API.

Tidak ada batasan langsung untuk hal berikut:

  • Ukuran image container yang dapat Anda deploy.
  • Jumlah permintaan serentak yang disalurkan oleh layanan Cloud Run.

Batas resource untuk Cloud Run

Untuk melampaui batas yang dapat ditingkatkan, minta penambahan kuota. Untuk melampaui batas per project yang tidak dapat ditingkatkan, buat resource baru di project atau region Google Cloud lain.

Resource Deskripsi Batas Cakupan Bisa ditingkatkan
Layanan Jumlah layanan maksimum 1000 per project dan region Tidak
Tugas Jumlah maksimum tugas 1000 per project dan region Tidak
Kumpulan pekerja Jumlah maksimum kumpulan pekerja 1000 per project dan region Tidak
Pelaksanaan tugas Jumlah maksimum eksekusi Tugas yang sedang berjalan 1000 per project dan region Tidak
Revisi Jumlah maksimum revisi per layanan. Setelah batas tercapai, revisi yang tidak ditampilkan akan otomatis dihapus berdasarkan urutan historis 1000 per layanan Tidak
Revisi Jumlah maksimum revisi yang menampilkan traffic 4000 per project dan region Tidak
Tag revisi Jumlah maksimum tag revisi. Jika batas tag revisi terlampaui, Cloud Run akan menjalankan pembersihan tag pada layanan. Untuk layanan yang tag barunya sedang dibuat, tag yang tidak memiliki persentase traffic yang ditentukan akan otomatis dihapus berdasarkan urutan historis. 2000 per project dan region Tidak
Pelaksanaan tugas Batas retensi untuk eksekusi tugas yang telah selesai. Jika jumlah eksekusi yang selesai untuk sebuah tugas mencapai batas ini, eksekusi akan otomatis dihapus dalam urutan historis 1.000 per tugas Tidak
Tugas eksekusi job1 Jumlah maksimum tugas yang dijalankan secara paralel Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. per eksekusi tugas Ya
Tugas eksekusi job Nilai maksimum waktu tunggu tugas 168 jam (7 hari), atau 1 jam jika menggunakan GPU per eksekusi tugas Tidak
Tugas eksekusi job Jumlah maksimum tugas dalam satu job 10.000 per eksekusi tugas Tidak
Tugas eksekusi job Jumlah maksimum percobaan ulang tugas dalam sebuah job 10 per eksekusi tugas Tidak
Variabel lingkungan Jumlah maksimum variabel lingkungan untuk setiap container 1000 per tugas atau per layanan Tidak
Argumen perintah Jumlah maksimum argumen perintah untuk setiap container 1000 per tugas atau per layanan Tidak
Instance penampung3 Jumlah maksimum instance container yang menggunakan traffic keluar VPC Langsung 100-200, bergantung pada konfigurasi region yang dipilih. per revisi dan region Ya
Instance container Waktu tunggu Startup, dalam menit 4 per instance container Tidak
Memori Ukuran memori maksimum, dalam GiB 32 per instance container Tidak
CPU Jumlah maksimum vCPU 8 per instance container Tidak
CPU1 Total CPU maksimum, dalam milli vCPU, yang dialokasikan di semua instance selama periode 1 menit. Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. per project dan region Ya
Memori1 Total memori maksimum, dalam byte, yang dialokasikan di semua instance selama periode 1 menit. Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. per project dan region Ya
Instance GPU tanpa jaminan redundansi zona1, 4 Jumlah maksimum instance container dengan GPU 04 per project per region Ya
Instance GPU dengan jaminan redundansi zona1, 4 Jumlah maksimum instance container dengan GPU 04 per project per region Ya
Disk Maksimumsistem file dalam memori yang dapat ditulis, dibatasi oleh memori instance, dalam GiB 32 per instance container Tidak
Variabel lingkungan Panjang variabel maksimum, dalam Kb 32 per variabel Tidak
Pemetaan domain Jumlah maksimum sertifikat SSL 50 per domain teratas dan per minggu Tidak
Pemetaan domain Jumlah maksimum sertifikat SSL duplikat 5 per domain teratas dan per minggu Tidak
Token akses Jumlah maksimum token akses unik yang dibuat 50 per instance container per detik Tidak
Token identitas Jumlah maksimum token identitas unik yang dibuat 50 per instance container per detik Tidak
File dibuka Jumlah maksimum file yang dapat dibuka secara bersamaan. Sesuai dengan
/proc/sys/fs/file-max.
25000 per instance container Tidak

1Kuota regional ini digunakan dalam beberapa kasus yang masing-masing mengontrol:

  1. Nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.

  2. Paralelisme maksimum tugas. Setelah diberikan di wilayah tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.

  3. Total instance container untuk menjalankan eksekusi tugas di suatu region.

3Kuota regional ini digunakan dalam beberapa kasus:

  1. Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi menggunakan keluar VPC Langsung. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.

  2. Class ini mengontrol paralelisme maksimum sebuah tugas menggunakan Traffic keluar VPC langsung. Setelah diberikan di region tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.

4 Project baru yang membuat layanan dengan GPU L4 akan otomatis diberi 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Anda juga dapat meminta kuota NvidiaL4GpuAllocPerProjectRegion atau NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Jika penggunaan GPU puncak Anda tidak mendekati kuota, Google mungkin akan mengurangi kuota Anda.

Batas jaringan untuk Cloud Run

Batas permintaan untuk Cloud Run

Deskripsi Batas Catatan
Jumlah maksimum permintaan serentak per instance 1000
Jumlah maksimum streaming serentak per koneksi klien HTTP/2 100
Waktu maksimum sebelum waktu tunggu habis per permintaan 60 menit
Ukuran permintaan HTTP/1 maksimum 32 MiB jika menggunakan server HTTP/1. Tidak ada batas jika menggunakan server HTTP/2.
Ukuran respons HTTP/1 maksimum 32 MiB jika tidak menggunakan Transfer-Encoding: chunked atau mekanisme streaming
Jumlah maksimum koneksi terbuka per instance per jenis keluar (Internet atau VPC) 50000 Tidak berlaku untuk traffic keluar VPC Langsung.
Koneksi keluar per detik per instance 700 Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi.
Koneksi keluar per menit per instance 5000 Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi.
Resolusi DNS keluar per detik per instance 1000
Permintaan masuk per detik ke port container HTTP/1 per instance 800 Tidak berlaku untuk port container HTTP/2.

Batas bandwidth untuk Cloud Run

Batas bandwidth berikut berlaku untuk instance Cloud Run:

Deskripsi Batas Catatan
Bit maksimum per instance untuk traffic keluar melalui VPC Langsung 1 Gbps Traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC.
Bit maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC 600 Mbps Berdasarkan jumlah bit masuk dan keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC.
Total kecepatan paket maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC 64.000 paket per detik Berdasarkan jumlah paket masuk dan paket keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC.

Jika salah satu dari dua batas tersebut tercapai, instance Cloud Run akan memiliki bandwidth yang terbatas.

Batas kapasitas Cloud Run Admin API

Batas kapasitas berikut berlaku untuk Cloud Run Admin API. Batasan ini tidak berlaku untuk permintaan yang mencapai layanan Cloud Run yang di-deploy.

Kuota Deskripsi Batas Bisa ditingkatkan Cakupan
Permintaan baca Cloud Run Admin API Jumlah operasi baca API per 60 detik per region. Ini bukan jumlah permintaan baca ke layanan Cloud Run Anda, yang mana itu tidak terbatas. 3.000 per 60 detik Ya per project dan region
Permintaan tulis Cloud Run Admin API Jumlah operasi tulis API per 60 detik per region. Ini bukan jumlah permintaan tulis ke layanan Cloud Run Anda, yang mana itu tidak terbatas. 180 per 60 detik Ya per project dan region
Eksekusi Tugas Frekuensi maksimum tugas dapat dijalankan per 60 detik per region. 180 per 60 detik Ya per project dan region

Cara menambah kuota

Permintaan penyesuaian Kuota Cloud akan ditinjau. Jika permintaan penyesuaian kuota Anda memerlukan peninjauan, Anda akan menerima email yang menyatakan bahwa permintaan Anda telah diterima. Jika Anda memerlukan bantuan lebih lanjut, balas email ini. Setelah meninjau permintaan Anda, Anda akan menerima email notifikasi yang menunjukkan apakah permintaan Anda disetujui atau tidak.

Konsol

Untuk menyesuaikan nilai kuota, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:

    Buka Quotas & System Limits

    Jika diminta untuk memilih project, pilih project yang ingin Anda sesuaikan.

  2. Temukan nilai kuota yang ingin Anda perbarui di kolom Quota, lalu centang kotak di samping kuota yang ingin Anda perbarui.

    Jika perlu, gunakan kotak penelusuran Filter untuk mencari kuota.

  3. Klik Edit dan dialog Quota changes akan muncul.

  4. Masukkan nilai kuota yang diinginkan di kolom New value. Beberapa nilai kuota memiliki satuan pengukuran; jika berlaku, pilih satuan yang Anda inginkan dalam daftar di sebelahnya. Klik Done.

    Opsional: Jika Anda melihat kotak centang dengan teks I understand that this request will remove any overrides, artinya menyesuaikan nilai kuota ke angka yang sama dengan atau lebih besar dari nilai default akan menghapus penggantian kuota sebelumnya. Jika Anda menginginkannya, centang kotak dan lanjutkan.

  5. Untuk meningkatkan nilai kuota Anda lebih besar dari jumlah yang ditunjukkan pada dialog, pilih Ajukan permintaan kuota yang lebih tinggi.

    1. Di formulir Perubahan kuota, masukkan nilai kuota yang diperbarui yang Anda inginkan di kolom Nilai baru. Jika kolom Deskripsi permintaan muncul, masukkan deskripsi. Klik Done.

    2. Jika tombol Berikutnya muncul, klik Berikutnya dan isi detail kontak Anda di layar berikutnya.

  6. Klik Submit request.

Jika Anda mendapati bahwa Anda tidak dapat meminta penyesuaian dari konsol, mintalah penambahan dari Cloud Customer Care.

Untuk mempelajari lebih lanjut cara kerja proses penambahan kuota, lihat Tentang penyesuaian kuota.

Mengelompokkan permintaan untuk nilai kuota yang lebih tinggi

Anda dapat membuat permintaan batch untuk kuota yang lebih tinggi dengan mencentang kotak di samping setiap kuota yang ingin disertakan. Namun, pengelompokan permintaan dapat meningkatkan waktu yang diperlukan Google Cloud untuk meninjau permintaan Anda.

Untuk mengurangi waktu peninjauan, kelompokkan permintaan penyesuaian kuota menurut produk dan area. Misalnya, jika Anda ingin meminta penyesuaian pada kuota VM Compute Engine dan jaringan, buat satu permintaan untuk kuota jaringan dan permintaan lain untuk kuota VM Compute Engine.