Halaman ini berisi kuota penggunaan dan batas yang berlaku saat menggunakan Cloud Run.
Jumlah resource pada Cloud Run terbatas. Kuota untuk Cloud Run mencakup batas kapasitas API, yang memengaruhi tingkat panggilan ke Cloud Run Admin API.
Tidak ada batasan langsung untuk hal berikut:
- Ukuran image container yang dapat Anda deploy.
- Jumlah permintaan serentak yang disalurkan oleh layanan Cloud Run.
Batas resource untuk Cloud Run
Untuk melampaui batas yang dapat ditingkatkan, minta penambahan kuota. Untuk melampaui batas per project yang tidak dapat ditingkatkan, buat resource baru di project atau region Google Cloud lain.
| Resource | Deskripsi | Batas | Cakupan | Bisa ditingkatkan |
|---|---|---|---|---|
| Layanan | Jumlah layanan maksimum | 1000 | per project dan region | Tidak |
| Tugas | Jumlah maksimum tugas | 1000 | per project dan region | Tidak |
| Kumpulan pekerja | Jumlah maksimum kumpulan pekerja | 1000 | per project dan region | Tidak |
| Pelaksanaan tugas | Jumlah maksimum eksekusi Tugas yang sedang berjalan | 1000 | per project dan region | Tidak |
| Revisi | Jumlah maksimum revisi per layanan. Setelah batas tercapai, revisi yang tidak ditampilkan akan otomatis dihapus berdasarkan urutan historis | 1000 | per layanan | Tidak |
| Revisi | Jumlah maksimum revisi yang menampilkan traffic | 4000 | per project dan region | Tidak |
| Tag revisi | Jumlah maksimum tag revisi. Jika batas tag revisi terlampaui, Cloud Run akan menjalankan pembersihan tag pada layanan. Untuk layanan yang tag barunya sedang dibuat, tag yang tidak memiliki persentase traffic yang ditentukan akan otomatis dihapus berdasarkan urutan historis. | 2000 | per project dan region | Tidak |
| Pelaksanaan tugas | Batas retensi untuk eksekusi tugas yang telah selesai. Jika jumlah eksekusi yang selesai untuk sebuah tugas mencapai batas ini, eksekusi akan otomatis dihapus dalam urutan historis | 1.000 | per tugas | Tidak |
| Tugas eksekusi job1 | Jumlah maksimum tugas yang dijalankan secara paralel | Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. | per eksekusi tugas | Ya |
| Tugas eksekusi job | Nilai maksimum waktu tunggu tugas | 168 jam (7 hari), atau 1 jam jika menggunakan GPU | per eksekusi tugas | Tidak |
| Tugas eksekusi job | Jumlah maksimum tugas dalam satu job | 10.000 | per eksekusi tugas | Tidak |
| Tugas eksekusi job | Jumlah maksimum percobaan ulang tugas dalam sebuah job | 10 | per eksekusi tugas | Tidak |
| Variabel lingkungan | Jumlah maksimum variabel lingkungan untuk setiap container | 1000 | per tugas atau per layanan | Tidak |
| Argumen perintah | Jumlah maksimum argumen perintah untuk setiap container | 1000 | per tugas atau per layanan | Tidak |
| Instance penampung3 | Jumlah maksimum instance container yang menggunakan traffic keluar VPC Langsung | 100-200, bergantung pada konfigurasi region yang dipilih. | per revisi dan region | Ya |
| Instance container | Waktu tunggu Startup, dalam menit | 4 | per instance container | Tidak |
| Memori | Ukuran memori maksimum, dalam GiB | 32 | per instance container | Tidak |
| CPU | Jumlah maksimum vCPU | 8 | per instance container | Tidak |
| CPU1 | Total CPU maksimum, dalam milli vCPU, yang dialokasikan di semua instance selama periode 1 menit. | Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. | per project dan region | Ya |
| Memori1 | Total memori maksimum, dalam byte, yang dialokasikan di semua instance selama periode 1 menit. | Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. | per project dan region | Ya |
| Instance GPU tanpa jaminan redundansi zona1, 4 | Jumlah maksimum instance container dengan GPU | 04 | per project per region | Ya |
| Instance GPU dengan jaminan redundansi zona1, 4 | Jumlah maksimum instance container dengan GPU | 04 | per project per region | Ya |
| Disk | Maksimumsistem file dalam memori yang dapat ditulis, dibatasi oleh memori instance, dalam GiB | 32 | per instance container | Tidak |
| Variabel lingkungan | Panjang variabel maksimum, dalam Kb | 32 | per variabel | Tidak |
| Pemetaan domain | Jumlah maksimum sertifikat SSL | 50 | per domain teratas dan per minggu | Tidak |
| Pemetaan domain | Jumlah maksimum sertifikat SSL duplikat | 5 | per domain teratas dan per minggu | Tidak |
| Token akses | Jumlah maksimum token akses unik yang dibuat | 50 | per instance container per detik | Tidak |
| Token identitas | Jumlah maksimum token identitas unik yang dibuat | 50 | per instance container per detik | Tidak |
| File dibuka | Jumlah maksimum file yang dapat dibuka secara bersamaan. Sesuai dengan /proc/sys/fs/file-max. |
25000 | per instance container | Tidak |
1Kuota regional ini digunakan dalam beberapa kasus yang masing-masing mengontrol:
Nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.
Paralelisme maksimum sebuah tugas. Setelah diberikan di wilayah tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.
Total instance container untuk menjalankan eksekusi tugas di suatu region.
3Kuota regional ini digunakan dalam beberapa kasus:
Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi menggunakan keluar VPC Langsung. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.
Class ini mengontrol paralelisme maksimum sebuah tugas menggunakan Traffic keluar VPC langsung. Setelah diberikan di region tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.
4 Project baru yang membuat layanan dengan GPU L4 akan otomatis diberi 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Anda juga dapat meminta kuota NvidiaL4GpuAllocPerProjectRegion atau NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Jika penggunaan GPU puncak Anda tidak mendekati kuota, Google mungkin akan mengurangi kuota Anda.
Batas jaringan untuk Cloud Run
Batas permintaan untuk Cloud Run
| Deskripsi | Batas | Catatan |
|---|---|---|
| Jumlah maksimum permintaan serentak per instance | 1000 | |
| Jumlah maksimum streaming serentak per koneksi klien HTTP/2 | 100 | |
| Waktu maksimum sebelum waktu tunggu habis per permintaan | 60 menit | |
| Ukuran permintaan HTTP/1 maksimum | 32 MiB jika menggunakan server HTTP/1. Tidak ada batas jika menggunakan server HTTP/2. | |
| Ukuran respons HTTP/1 maksimum | 32 MiB jika tidak menggunakan Transfer-Encoding: chunked atau mekanisme streaming |
|
| Jumlah maksimum koneksi terbuka per instance per jenis keluar (Internet atau VPC) | 50000 | Tidak berlaku untuk traffic keluar VPC Langsung. |
| Koneksi keluar per detik per instance | 700 | Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi. |
| Koneksi keluar per menit per instance | 5000 | Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi. |
| Resolusi DNS keluar per detik per instance | 1000 | |
| Permintaan masuk per detik ke port container HTTP/1 per instance | 800 | Tidak berlaku untuk port container HTTP/2. |
Batas bandwidth untuk Cloud Run
Batas bandwidth berikut berlaku untuk instance Cloud Run:
| Deskripsi | Batas | Catatan |
|---|---|---|
| Bit maksimum per instance untuk traffic keluar melalui VPC Langsung | 1 Gbps | Traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC. |
| Bit maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC | 600 Mbps | Berdasarkan jumlah bit masuk dan keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC. |
| Total tarif paket maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC | 64.000 paket per detik | Berdasarkan jumlah paket masuk dan paket keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC. |
Jika salah satu dari dua batas tersebut tercapai, instance Cloud Run akan memiliki bandwidth yang terbatas.
Batas kapasitas Cloud Run Admin API
Batas kapasitas berikut berlaku untuk Cloud Run Admin API. Batasan ini tidak berlaku untuk permintaan yang mencapai layanan Cloud Run yang di-deploy.
| Kuota | Deskripsi | Batas | Bisa ditingkatkan | Cakupan |
|---|---|---|---|---|
| Permintaan baca Cloud Run Admin API | Jumlah operasi baca API per 60 detik per region. Ini bukan jumlah permintaan baca ke layanan Cloud Run Anda, yang mana itu tidak terbatas. | 3.000 per 60 detik | Ya | per project dan region |
| Permintaan tulis Cloud Run Admin API | Jumlah operasi tulis API per 60 detik per region. Ini bukan jumlah permintaan tulis ke layanan Cloud Run Anda, yang mana itu tidak terbatas. | 180 per 60 detik | Ya | per project dan region |
| Eksekusi Tugas | Frekuensi maksimum tugas dapat dijalankan per 60 detik per region. | 180 per 60 detik | Ya | per project dan region |
Cara menambah kuota
Permintaan penyesuaian Kuota Cloud akan ditinjau. Jika permintaan penyesuaian kuota Anda memerlukan peninjauan, Anda akan menerima email yang menyatakan bahwa permintaan Anda telah diterima. Jika Anda memerlukan bantuan lebih lanjut, balas email ini. Setelah meninjau permintaan Anda, Anda akan menerima email notifikasi yang menunjukkan apakah permintaan Anda disetujui atau tidak. Anda dapat meminta penyesuaian kuota menggunakan konsol Google Cloud , Cloud Quotas API, atau Google Cloud CLI. Petunjuk berikut menunjukkan cara meminta nilai kuota baru menggunakan konsol Google Cloud atau dengan membuat permintaan REST ke Cloud Quotas API.
Konsol
Untuk meminta penyesuaian kuota, ikuti langkah-langkah berikut:
Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:
Jika diminta untuk memilih project, pilih project yang ingin Anda sesuaikan.Temukan kuota yang ingin Anda sesuaikan, lalu buka dialog Perubahan kuota:
Kuota yang tidak ada dalam tabel:
- Telusuri kuota Anda di kotak penelusuran Filter. Jangan tentukan wilayah atau zona (jika berlaku) karena kuota yang tidak memiliki nilai penggunaan atau yang disesuaikan tidak ditampilkan dalam tabel.
- Temukan entri apa pun untuk kuota Anda dalam tabel. Ini dapat berupa entri default atau entri apa pun dengan histori, terlepas dari region atau zona.
- Di baris untuk entri, klik Tindakan lainnya > Konfigurasi wilayah/zona tambahan.
- Pilih wilayah atau zona yang ingin Anda sesuaikan. Klik Edit.
Semua kuota lainnya:
- Telusuri kuota Anda di kotak penelusuran Filter.
- Di baris untuk entri, centang kotak untuk kuota Anda.
- Klik Edit.
Dialog Quota changes akan muncul.
Jika Anda melihat link Minta kuota lebih tinggi di atas kolom Nilai baru dan Anda ingin menambah nilai kuota melampaui jumlah yang ditunjukkan di layar, ikuti link tersebut. Isi formulirnya, kirim, dan lewati langkah-langkah berikutnya di sini. Jika tidak, lanjutkan mengikuti panduan ini.
Di kolom Nilai baru, masukkan nilai kuota yang ingin Anda tingkatkan. Jika kolom Deskripsi permintaan muncul, masukkan deskripsi. Klik Done.
- Jika Anda melihat kotak centang dengan teks "Saya memahami bahwa permintaan ini akan menghapus semua penggantian", nilai kuota Anda ditetapkan di bawah nilai default. Menyesuaikan nilai kuota ke atau di luar nilai default akan menghapus penggantian. Untuk melanjutkan, centang kotak. Pelajari lebih lanjut penggantian kuota.
Jika tombol Berikutnya muncul, klik Berikutnya dan isi detail kontak Anda di layar berikutnya.
Klik Submit request.
Jika Anda mendapati bahwa Anda tidak dapat meminta penyesuaian dari konsol, mintalah penambahan dari Cloud Customer Care.
Untuk mempelajari lebih lanjut cara kerja proses penambahan kuota, lihat Tentang penyesuaian kuota.
Mengelompokkan permintaan penyesuaian kuota
Anda dapat membuat permintaan massal untuk penyesuaian kuota dengan mencentang kotak untuk setiap kuota yang ingin disertakan. Namun, pengelompokan permintaan dapat meningkatkan waktu yang diperlukan untuk Google Cloud meninjau permintaan Anda.
Untuk mengurangi waktu peninjauan, kelompokkan permintaan penyesuaian kuota menurut produk dan area. Misalnya, jika Anda ingin meminta penyesuaian kuota VM Compute Engine dan jaringan, buat satu permintaan untuk kuota jaringan dan permintaan lain untuk kuota VM Compute Engine.
REST
Untuk meminta penyesuaian kuota dari Cloud Quotas API, gunakan contoh kode berikut. Isi placeholder yang dapat diedit dengan nilai Anda. Untuk mempelajari kolom placeholder, lihat deskripsi setelah contoh kode.
POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID { "service": "SERVICE_ID", "quotaId": "QUOTA_ID", "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" }, "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" }, "justification": "JUSTIFICATION", "contactEmail": "EMAIL" }
Ganti kode berikut:
PROJECT_NUMBER: Nomor project Google Cloud Anda. Anda dapat menemukan nomor project di halaman Selamat Datang di konsol Google Cloud atau dengan menjalankan perintah gcloud CLI berikut:PROJECT=$(gcloud info --format='value(config.project)') gcloud projects describe ${PROJECT} --format="value(projectNumber)"
QUOTA_PREFERENCE_ID: ID preferensi kuota yang Anda perbarui.QUOTA_ID: ID kuota yang Anda perbarui.SERVICE_ID: ID Google Cloud yang kuota yang Anda sesuaikan termasuk di dalamnya. Biasanya dalam bentukSERVICE_NAME.googleapis.com. Misalnya, nama layanan Compute Engine adalahcompute.googleapis.com.DIMENSION_1: Jenis dimensi yang ingin Anda sesuaikan—misalnya,regionatauzone—. Anda dapat menyertakan beberapa dimensi. Pisahkan setiap dimensi dengan mengikuti nilainya— misalnya,VALUE_1—dengan koma. Untuk menyesuaikan semua dimensi kuota, hapus baris ini.VALUE_1: Nilai dimensi sebelumnya. Misalnya, jika dimensi sebelumnya adalahregion, masukkan wilayah sepertius-central1.JUSTIFICATION: Alasan permintaan ini.EMAIL: Alamat email yang dapat digunakan sebagai kontak, jika Google Cloud membutuhkan informasi lebih lanjut untuk membuat keputusan sebelum kuota tambahan dapat diberikan.
Contoh permintaan
Berikut adalah contoh permintaan penambahan nilai kuota untuk kuota Compute Engine PUS-PER-GPU-FAMILY-per-project-region. Permintaan ini meminta nilai kuota 100 untuk mesin dari kelompok GPU NVIDIA_H100 yang berada di region us-central1.
POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
"service": "compute.googleapis.com",
"quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
"quotaConfig": { "preferredValue": 100 },
"dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
"justification": "My justification.",
"contactEmail": "222larabrown@gmail.com"
}