Kuota dan Batas Cloud Run

Halaman ini berisi kuota penggunaan dan batas yang berlaku saat menggunakan Cloud Run.

Jumlah resource pada Cloud Run terbatas. Kuota untuk Cloud Run mencakup batas kapasitas API, yang memengaruhi tingkat panggilan ke Cloud Run Admin API.

Tidak ada batasan langsung untuk hal berikut:

  • Ukuran image container yang dapat Anda deploy.
  • Jumlah permintaan serentak yang disalurkan oleh layanan Cloud Run.

Batas resource untuk Cloud Run

Untuk melampaui batas yang dapat ditingkatkan, minta penambahan kuota. Untuk melampaui batas per project yang tidak dapat ditingkatkan, buat resource baru di project atau region Google Cloud lain.

Resource Deskripsi Batas Cakupan Bisa ditingkatkan
Layanan Jumlah layanan maksimum 1000 per project dan region Tidak
Tugas Jumlah maksimum tugas 1000 per project dan region Tidak
Kumpulan pekerja Jumlah maksimum kumpulan pekerja 1000 per project dan region Tidak
Pelaksanaan tugas Jumlah maksimum eksekusi Tugas yang sedang berjalan 1000 per project dan region Tidak
Revisi Jumlah maksimum revisi per layanan. Setelah batas tercapai, revisi yang tidak ditampilkan akan otomatis dihapus berdasarkan urutan historis 1000 per layanan Tidak
Revisi Jumlah maksimum revisi yang menampilkan traffic 4000 per project dan region Tidak
Tag revisi Jumlah maksimum tag revisi. Jika batas tag revisi terlampaui, Cloud Run akan menjalankan pembersihan tag pada layanan. Untuk layanan yang tag barunya sedang dibuat, tag yang tidak memiliki persentase traffic yang ditentukan akan otomatis dihapus berdasarkan urutan historis. 2000 per project dan region Tidak
Pelaksanaan tugas Batas retensi untuk eksekusi tugas yang telah selesai. Jika jumlah eksekusi yang selesai untuk sebuah tugas mencapai batas ini, eksekusi akan otomatis dihapus dalam urutan historis 1.000 per tugas Tidak
Tugas eksekusi job1 Jumlah maksimum tugas yang dijalankan secara paralel Bergantung pada region serta konfigurasi CPU dan memori yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. per eksekusi tugas Ya
Tugas eksekusi job Nilai maksimum waktu tunggu tugas 168 jam (7 hari), atau 1 jam jika menggunakan GPU per eksekusi tugas Tidak
Tugas eksekusi job Jumlah maksimum tugas dalam satu job 10.000 per eksekusi tugas Tidak
Tugas eksekusi job Jumlah maksimum percobaan ulang tugas dalam sebuah job 10 per eksekusi tugas Tidak
Variabel lingkungan Jumlah maksimum variabel lingkungan untuk setiap container 1000 per tugas atau per layanan Tidak
Argumen perintah Jumlah maksimum argumen perintah untuk setiap container 1000 per tugas atau per layanan Tidak
Instance penampung3 Jumlah maksimum instance container yang menggunakan traffic keluar VPC Langsung 100-200, bergantung pada konfigurasi region yang dipilih. per revisi dan region Ya
Instance container Waktu tunggu Startup, dalam menit 4 per instance container Tidak
Memori Ukuran memori maksimum, dalam GiB 32 per instance container Tidak
CPU Jumlah maksimum vCPU 8 per instance container Tidak
CPU1 Total CPU maksimum, dalam milli vCPU, yang dialokasikan di semua instance selama periode 1 menit. Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. per project dan region Ya
Memori1 Total memori maksimum, dalam byte, yang dialokasikan di semua instance selama periode 1 menit. Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka. Anda dapat melihat kuota di halaman konsol Kuota dan batas sistem. per project dan region Ya
Instance GPU tanpa jaminan redundansi zona1, 4 Jumlah maksimum instance container dengan GPU 04 per project per region Ya
Instance GPU dengan jaminan redundansi zona1, 4 Jumlah maksimum instance container dengan GPU 04 per project per region Ya
Disk Maksimumsistem file dalam memori yang dapat ditulis, dibatasi oleh memori instance, dalam GiB 32 per instance container Tidak
Variabel lingkungan Panjang variabel maksimum, dalam Kb 32 per variabel Tidak
Pemetaan domain Jumlah maksimum sertifikat SSL 50 per domain teratas dan per minggu Tidak
Pemetaan domain Jumlah maksimum sertifikat SSL duplikat 5 per domain teratas dan per minggu Tidak
Token akses Jumlah maksimum token akses unik yang dibuat 50 per instance container per detik Tidak
Token identitas Jumlah maksimum token identitas unik yang dibuat 50 per instance container per detik Tidak
File dibuka Jumlah maksimum file yang dapat dibuka secara bersamaan. Sesuai dengan
/proc/sys/fs/file-max.
25000 per instance container Tidak

1Kuota regional ini digunakan dalam beberapa kasus yang masing-masing mengontrol:

  1. Nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.

  2. Paralelisme maksimum sebuah tugas. Setelah diberikan di wilayah tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.

  3. Total instance container untuk menjalankan eksekusi tugas di suatu region.

3Kuota regional ini digunakan dalam beberapa kasus:

  1. Atribut ini mengontrol nilai maksimum yang dapat dipilih untuk atribut instance maksimum revisi menggunakan keluar VPC Langsung. Setelah diberikan di region tertentu, semua revisi di region tersebut dapat mencapai batas yang diberikan.

  2. Class ini mengontrol paralelisme maksimum sebuah tugas menggunakan Traffic keluar VPC langsung. Setelah diberikan di region tertentu, semua tugas di region tersebut dapat mencapai batas yang diberikan.

4 Project baru yang membuat layanan dengan GPU L4 akan otomatis diberi 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Anda juga dapat meminta kuota NvidiaL4GpuAllocPerProjectRegion atau NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Jika penggunaan GPU puncak Anda tidak mendekati kuota, Google mungkin akan mengurangi kuota Anda.

Batas jaringan untuk Cloud Run

Batas permintaan untuk Cloud Run

Deskripsi Batas Catatan
Jumlah maksimum permintaan serentak per instance 1000
Jumlah maksimum streaming serentak per koneksi klien HTTP/2 100
Waktu maksimum sebelum waktu tunggu habis per permintaan 60 menit
Ukuran permintaan HTTP/1 maksimum 32 MiB jika menggunakan server HTTP/1. Tidak ada batas jika menggunakan server HTTP/2.
Ukuran respons HTTP/1 maksimum 32 MiB jika tidak menggunakan Transfer-Encoding: chunked atau mekanisme streaming
Jumlah maksimum koneksi terbuka per instance per jenis keluar (Internet atau VPC) 50000 Tidak berlaku untuk traffic keluar VPC Langsung.
Koneksi keluar per detik per instance 700 Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi.
Koneksi keluar per menit per instance 5000 Tidak berlaku untuk traffic keluar VPC Langsung yang dikirim ke jaringan VPC, yang tidak dibatasi.
Resolusi DNS keluar per detik per instance 1000
Permintaan masuk per detik ke port container HTTP/1 per instance 800 Tidak berlaku untuk port container HTTP/2.

Batas bandwidth untuk Cloud Run

Batas bandwidth berikut berlaku untuk instance Cloud Run:

Deskripsi Batas Catatan
Bit maksimum per instance untuk traffic keluar melalui VPC Langsung 1 Gbps Traffic keluar melalui traffic keluar VPC Langsung ke tujuan di jaringan VPC.
Bit maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC 600 Mbps Berdasarkan jumlah bit masuk dan keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC.
Total tarif paket maksimum per instance, tidak termasuk traffic keluar melalui Direct VPC 64.000 paket per detik Berdasarkan jumlah paket masuk dan paket keluar, tidak termasuk traffic keluar melalui Traffic keluar VPC langsung ke tujuan di jaringan VPC.

Jika salah satu dari dua batas tersebut tercapai, instance Cloud Run akan memiliki bandwidth yang terbatas.

Batas kapasitas Cloud Run Admin API

Batas kapasitas berikut berlaku untuk Cloud Run Admin API. Batasan ini tidak berlaku untuk permintaan yang mencapai layanan Cloud Run yang di-deploy.

Kuota Deskripsi Batas Bisa ditingkatkan Cakupan
Permintaan baca Cloud Run Admin API Jumlah operasi baca API per 60 detik per region. Ini bukan jumlah permintaan baca ke layanan Cloud Run Anda, yang mana itu tidak terbatas. 3.000 per 60 detik Ya per project dan region
Permintaan tulis Cloud Run Admin API Jumlah operasi tulis API per 60 detik per region. Ini bukan jumlah permintaan tulis ke layanan Cloud Run Anda, yang mana itu tidak terbatas. 180 per 60 detik Ya per project dan region
Eksekusi Tugas Frekuensi maksimum tugas dapat dijalankan per 60 detik per region. 180 per 60 detik Ya per project dan region

Cara menambah kuota

Permintaan penyesuaian Kuota Cloud akan ditinjau. Jika permintaan penyesuaian kuota Anda memerlukan peninjauan, Anda akan menerima email yang menyatakan bahwa permintaan Anda telah diterima. Jika Anda memerlukan bantuan lebih lanjut, balas email ini. Setelah meninjau permintaan Anda, Anda akan menerima email notifikasi yang menunjukkan apakah permintaan Anda disetujui atau tidak. Anda dapat meminta penyesuaian kuota menggunakan konsol Google Cloud , Cloud Quotas API, atau Google Cloud CLI. Petunjuk berikut menunjukkan cara meminta nilai kuota baru menggunakan konsol Google Cloud atau dengan membuat permintaan REST ke Cloud Quotas API.

Konsol

Untuk meminta penyesuaian kuota, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:

    Buka Quotas & System Limits

    Jika diminta untuk memilih project, pilih project yang ingin Anda sesuaikan.

  2. Temukan kuota yang ingin Anda sesuaikan, lalu buka dialog Perubahan kuota:

    • Kuota yang tidak ada dalam tabel:

      • Telusuri kuota Anda di kotak penelusuran Filter. Jangan tentukan wilayah atau zona (jika berlaku) karena kuota yang tidak memiliki nilai penggunaan atau yang disesuaikan tidak ditampilkan dalam tabel.
      • Temukan entri apa pun untuk kuota Anda dalam tabel. Ini dapat berupa entri default atau entri apa pun dengan histori, terlepas dari region atau zona.
      • Di baris untuk entri, klik Tindakan lainnya > Konfigurasi wilayah/zona tambahan.
      • Pilih wilayah atau zona yang ingin Anda sesuaikan. Klik Edit.
    • Semua kuota lainnya:

      • Telusuri kuota Anda di kotak penelusuran Filter.
      • Di baris untuk entri, centang kotak untuk kuota Anda.
      • Klik Edit.

    Dialog Quota changes akan muncul.

  3. Jika Anda melihat link Minta kuota lebih tinggi di atas kolom Nilai baru dan Anda ingin menambah nilai kuota melampaui jumlah yang ditunjukkan di layar, ikuti link tersebut. Isi formulirnya, kirim, dan lewati langkah-langkah berikutnya di sini. Jika tidak, lanjutkan mengikuti panduan ini.

  4. Di kolom Nilai baru, masukkan nilai kuota yang ingin Anda tingkatkan. Jika kolom Deskripsi permintaan muncul, masukkan deskripsi. Klik Done.

    • Jika Anda melihat kotak centang dengan teks "Saya memahami bahwa permintaan ini akan menghapus semua penggantian", nilai kuota Anda ditetapkan di bawah nilai default. Menyesuaikan nilai kuota ke atau di luar nilai default akan menghapus penggantian. Untuk melanjutkan, centang kotak. Pelajari lebih lanjut penggantian kuota.

    Jika tombol Berikutnya muncul, klik Berikutnya dan isi detail kontak Anda di layar berikutnya.

  5. Klik Submit request.

Jika Anda mendapati bahwa Anda tidak dapat meminta penyesuaian dari konsol, mintalah penambahan dari Cloud Customer Care.

Untuk mempelajari lebih lanjut cara kerja proses penambahan kuota, lihat Tentang penyesuaian kuota.

Mengelompokkan permintaan penyesuaian kuota

Anda dapat membuat permintaan massal untuk penyesuaian kuota dengan mencentang kotak untuk setiap kuota yang ingin disertakan. Namun, pengelompokan permintaan dapat meningkatkan waktu yang diperlukan untuk Google Cloud meninjau permintaan Anda.

Untuk mengurangi waktu peninjauan, kelompokkan permintaan penyesuaian kuota menurut produk dan area. Misalnya, jika Anda ingin meminta penyesuaian kuota VM Compute Engine dan jaringan, buat satu permintaan untuk kuota jaringan dan permintaan lain untuk kuota VM Compute Engine.

REST

Untuk meminta penyesuaian kuota dari Cloud Quotas API, gunakan contoh kode berikut. Isi placeholder yang dapat diedit dengan nilai Anda. Untuk mempelajari kolom placeholder, lihat deskripsi setelah contoh kode.

POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID {
    "service": "SERVICE_ID",
    "quotaId": "QUOTA_ID",
    "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" },
    "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" },
    "justification": "JUSTIFICATION",
    "contactEmail": "EMAIL"
}

Ganti kode berikut:

  • PROJECT_NUMBER: Nomor project Google Cloud Anda. Anda dapat menemukan nomor project di halaman Selamat Datang di konsol Google Cloud atau dengan menjalankan perintah gcloud CLI berikut:

    PROJECT=$(gcloud info --format='value(config.project)')
    gcloud projects describe ${PROJECT} --format="value(projectNumber)"
  • QUOTA_PREFERENCE_ID: ID preferensi kuota yang Anda perbarui.

  • QUOTA_ID: ID kuota yang Anda perbarui.

  • SERVICE_ID: ID Google Cloud yang kuota yang Anda sesuaikan termasuk di dalamnya. Biasanya dalam bentuk SERVICE_NAME.googleapis.com. Misalnya, nama layanan Compute Engine adalah compute.googleapis.com.

  • DIMENSION_1: Jenis dimensi yang ingin Anda sesuaikan—misalnya, region atau zone—. Anda dapat menyertakan beberapa dimensi. Pisahkan setiap dimensi dengan mengikuti nilainya— misalnya, VALUE_1—dengan koma. Untuk menyesuaikan semua dimensi kuota, hapus baris ini.

  • VALUE_1: Nilai dimensi sebelumnya. Misalnya, jika dimensi sebelumnya adalah region, masukkan wilayah seperti us-central1.

  • JUSTIFICATION: Alasan permintaan ini.

  • EMAIL: Alamat email yang dapat digunakan sebagai kontak, jika Google Cloud membutuhkan informasi lebih lanjut untuk membuat keputusan sebelum kuota tambahan dapat diberikan.

Contoh permintaan

Berikut adalah contoh permintaan penambahan nilai kuota untuk kuota Compute Engine PUS-PER-GPU-FAMILY-per-project-region. Permintaan ini meminta nilai kuota 100 untuk mesin dari kelompok GPU NVIDIA_H100 yang berada di region us-central1.

POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
    "service": "compute.googleapis.com",
    "quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
    "quotaConfig": { "preferredValue": 100 },
    "dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
    "justification": "My justification.",
    "contactEmail": "222larabrown@gmail.com"
}