Halaman ini berisi kuota penggunaan dan batas yang berlaku saat menggunakan Cloud Run.
Jumlah resource pada Cloud Run terbatas. Kuota untuk Cloud Run mencakup batas kapasitas API, yang memengaruhi tingkat panggilan ke Cloud Run Admin API.
Tidak ada batasan langsung untuk hal berikut:
- Ukuran image container yang dapat Anda deploy.
- Jumlah permintaan serentak yang disalurkan oleh layanan Cloud Run.
Batas resource untuk Cloud Run
Untuk melampaui batas yang dapat ditingkatkan, minta penambahan kuota. Untuk melampaui batas per project yang tidak dapat ditingkatkan, buat resource baru di project atau region Google Cloud lain.
| Resource | Deskripsi | Batas | Cakupan | Bisa ditingkatkan |
|---|---|---|---|---|
| Layanan | Jumlah layanan maksimum | 1000 | per project dan region | Tidak |
| Tugas | Jumlah maksimum tugas | 1000 | per project dan region | Tidak |
| Kumpulan pekerja | Jumlah maksimum kumpulan pekerja | 1000 | per project dan region | Tidak |
| Pelaksanaan tugas | Jumlah maksimum eksekusi Tugas yang sedang berjalan | 1000 | per project dan region | Tidak |
| Revisi | Jumlah maksimum revisi per layanan. Setelah batas tercapai, revisi yang tidak ditampilkan akan otomatis dihapus berdasarkan urutan historis | 1000 | per layanan | Tidak |
| Revisi | Jumlah maksimum revisi yang menampilkan traffic | 4000 | per project dan region | Tidak |
| Tag revisi | Jumlah maksimum tag revisi. Jika batas tag revisi terlampaui, Cloud Run akan menjalankan pembersihan tag pada layanan. Untuk layanan yang tag barunya sedang dibuat, tag yang tidak memiliki persentase traffic yang ditentukan akan otomatis dihapus berdasarkan urutan historis. | 2000 | per project dan region | Tidak |
| Pelaksanaan tugas | Batas retensi untuk eksekusi tugas yang telah selesai. Jika jumlah eksekusi yang selesai untuk sebuah tugas mencapai batas ini, eksekusi akan otomatis dihapus dalam urutan historis | 1.000 | per tugas | Tidak |
| Tugas eksekusi job1 | Jumlah maksimum tugas yang dijalankan secara paralel | Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. | per eksekusi tugas | Ya |
| Tugas eksekusi job | Nilai maksimum waktu tunggu tugas | 168 jam (7 hari), atau 1 jam jika menggunakan GPU | per eksekusi tugas | Tidak |
| Tugas eksekusi job | Jumlah maksimum tugas dalam satu job | 10.000 | per eksekusi tugas | Tidak |
| Tugas eksekusi job | Jumlah maksimum percobaan ulang tugas dalam sebuah job | 10 | per eksekusi tugas | Tidak |
| Variabel lingkungan | Jumlah maksimum variabel lingkungan untuk setiap container | 1000 | per tugas atau per layanan | Tidak |
| Argumen perintah | Jumlah maksimum argumen perintah untuk setiap container | 1000 | per tugas atau per layanan | Tidak |
| Instance penampung3 | Jumlah maksimum instance container yang menggunakan traffic keluar VPC Langsung | 100-200, bergantung pada konfigurasi region yang dipilih. | per revisi dan region | Ya |
| Instance container | Waktu tunggu Startup, dalam menit | 4 | per instance container | Tidak |
| Memori | Ukuran memori maksimum, dalam GiB | 32 | per instance container | Tidak |
| CPU | Jumlah maksimum vCPU | 8 | per instance container | Tidak |
| CPU1 | Total CPU maksimum, dalam milli vCPU, yang dialokasikan di semua instance selama periode 1 menit. | Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. | per project dan region | Ya |
| Memori1 | Total memori maksimum, dalam byte, yang dialokasikan di semua instance selama periode 1 menit. | Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. | per project dan region | Ya |
| Instance GPU tanpa jaminan redundansi zona1, 4 | Jumlah maksimum instance container dengan GPU | 04 | per project per region | Ya |
| Instance GPU dengan jaminan redundansi zona1, 4 | Jumlah maksimum instance container dengan GPU | 04 | per project per region | Ya |
| Disk | Maksimumsistem file dalam memori yang dapat ditulis, dibatasi oleh memori instance, dalam GiB | 32 | per instance container | Tidak |
| Variabel lingkungan | Panjang variabel maksimum, dalam Kb | 32 | per variabel | Tidak |
| Pemetaan domain | Jumlah maksimum sertifikat SSL | 50 | per domain teratas dan per minggu | Tidak |
| Pemetaan domain | Jumlah maksimum sertifikat SSL duplikat | 5 | per domain teratas dan per minggu | Tidak |
| Token akses | Jumlah maksimum token akses unik yang dibuat | 50 | per instance container per detik | Tidak |
| Token identitas | Jumlah maksimum token identitas unik yang dibuat | 50 | per instance container per detik | Tidak |
| File dibuka | Jumlah maksimum file yang dapat dibuka secara bersamaan. Sesuai dengan /proc/sys/fs/file-max. |
25000 | per instance container | Tidak |
1Kuota regional ini digunakan dalam beberapa kasus yang masing-masing mengontrol:
Nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.
Paralelisme maksimum tugas. Setelah diberikan di wilayah tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.
Total instance container untuk menjalankan eksekusi tugas di suatu region.
3Kuota regional ini digunakan dalam beberapa kasus:
Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi menggunakan keluar VPC Langsung. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.
Class ini mengontrol paralelisme maksimum sebuah tugas menggunakan Traffic keluar VPC langsung. Setelah diberikan di region tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.
4 Project baru yang membuat layanan dengan GPU L4 akan otomatis diberi 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Anda juga dapat meminta kuota NvidiaL4GpuAllocPerProjectRegion atau NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Jika penggunaan GPU puncak Anda tidak mendekati kuota, Google mungkin akan mengurangi kuota Anda.
Batas jaringan untuk Cloud Run
Batas permintaan untuk Cloud Run
| Deskripsi | Batas | Catatan |
|---|---|---|
| Jumlah maksimum permintaan serentak per instance | 1000 | |
| Jumlah maksimum streaming serentak per koneksi klien HTTP/2 | 100 | |
| Waktu maksimum sebelum waktu tunggu habis per permintaan | 60 menit | |
| Ukuran permintaan HTTP/1 maksimum | 32 MiB jika menggunakan server HTTP/1. Tidak ada batas jika menggunakan server HTTP/2. | |
| Ukuran respons HTTP/1 maksimum | 32 MiB jika tidak menggunakan Transfer-Encoding: chunked atau mekanisme streaming |
|
| Jumlah maksimum koneksi terbuka per instance per jenis keluar (Internet atau VPC) | 50000 | Tidak berlaku untuk traffic keluar VPC Langsung. |
| Koneksi keluar per detik per instance | 700 | Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi. |
| Koneksi keluar per menit per instance | 5000 | Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi. |
| Resolusi DNS keluar per detik per instance | 1000 | |
| Permintaan masuk per detik ke port container HTTP/1 per instance | 800 | Tidak berlaku untuk port container HTTP/2. |
Batas bandwidth untuk Cloud Run
Batas bandwidth berikut berlaku untuk instance Cloud Run:
| Deskripsi | Batas | Catatan |
|---|---|---|
| Bit maksimum per instance untuk traffic keluar melalui VPC Langsung | 1 Gbps | Traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC. |
| Bit maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC | 600 Mbps | Berdasarkan jumlah bit masuk dan keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC. |
| Total kecepatan paket maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC | 64.000 paket per detik | Berdasarkan jumlah paket masuk dan paket keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC. |
Jika salah satu dari dua batas tersebut tercapai, instance Cloud Run akan memiliki bandwidth yang terbatas.
Batas kapasitas Cloud Run Admin API
Batas kapasitas berikut berlaku untuk Cloud Run Admin API. Batasan ini tidak berlaku untuk permintaan yang mencapai layanan Cloud Run yang di-deploy.
| Kuota | Deskripsi | Batas | Bisa ditingkatkan | Cakupan |
|---|---|---|---|---|
| Permintaan baca Cloud Run Admin API | Jumlah operasi baca API per 60 detik per region. Ini bukan jumlah permintaan baca ke layanan Cloud Run Anda, yang mana itu tidak terbatas. | 3.000 per 60 detik | Ya | per project dan region |
| Permintaan tulis Cloud Run Admin API | Jumlah operasi tulis API per 60 detik per region. Ini bukan jumlah permintaan tulis ke layanan Cloud Run Anda, yang mana itu tidak terbatas. | 180 per 60 detik | Ya | per project dan region |
| Eksekusi Tugas | Frekuensi maksimum tugas dapat dijalankan per 60 detik per region. | 180 per 60 detik | Ya | per project dan region |
Cara menambah kuota
Permintaan penyesuaian Kuota Cloud akan ditinjau. Jika permintaan penyesuaian kuota Anda memerlukan peninjauan, Anda akan menerima email yang menyatakan bahwa permintaan Anda telah diterima. Jika Anda memerlukan bantuan lebih lanjut, balas email ini. Setelah meninjau permintaan Anda, Anda akan menerima email notifikasi yang menunjukkan apakah permintaan Anda disetujui atau tidak.
Konsol
Untuk menyesuaikan nilai kuota, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:
Jika diminta untuk memilih project, pilih project yang ingin Anda sesuaikan.Temukan nilai kuota yang ingin Anda perbarui di kolom Quota, lalu centang kotak di samping kuota yang ingin Anda perbarui.
Jika perlu, gunakan kotak penelusuran Filter untuk mencari kuota.
Klik Edit dan dialog Quota changes akan muncul.
Masukkan nilai kuota yang diinginkan di kolom New value. Beberapa nilai kuota memiliki satuan pengukuran; jika berlaku, pilih satuan yang Anda inginkan dalam daftar di sebelahnya. Klik Done.
Opsional: Jika Anda melihat kotak centang dengan teks
I understand that this request will remove any overrides, artinya menyesuaikan nilai kuota ke angka yang sama dengan atau lebih besar dari nilai default akan menghapus penggantian kuota sebelumnya. Jika Anda menginginkannya, centang kotak dan lanjutkan.Untuk meningkatkan nilai kuota Anda lebih besar dari jumlah yang ditunjukkan pada dialog, pilih Ajukan permintaan kuota yang lebih tinggi.
Di formulir Perubahan kuota, masukkan nilai kuota yang diperbarui yang Anda inginkan di kolom Nilai baru. Jika kolom Deskripsi permintaan muncul, masukkan deskripsi. Klik Done.
Jika tombol Berikutnya muncul, klik Berikutnya dan isi detail kontak Anda di layar berikutnya.
Klik Submit request.
Jika Anda mendapati bahwa Anda tidak dapat meminta penyesuaian dari konsol, mintalah penambahan dari Cloud Customer Care.
Untuk mempelajari lebih lanjut cara kerja proses penambahan kuota, lihat Tentang penyesuaian kuota.
Mengelompokkan permintaan untuk nilai kuota yang lebih tinggi
Anda dapat membuat permintaan batch untuk kuota yang lebih tinggi dengan mencentang kotak di samping setiap kuota yang ingin disertakan. Namun, pengelompokan permintaan dapat meningkatkan waktu yang diperlukan Google Cloud untuk meninjau permintaan Anda.
Untuk mengurangi waktu peninjauan, kelompokkan permintaan penyesuaian kuota menurut produk dan area. Misalnya, jika Anda ingin meminta penyesuaian pada kuota VM Compute Engine dan jaringan, buat satu permintaan untuk kuota jaringan dan permintaan lain untuk kuota VM Compute Engine.