Kuota dan batas

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Media CDN.

  • Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.

Sistem Kuota Cloud melakukan hal berikut:

Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.

Ada juga batas sistem pada resource Media CDN. Batas sistem tidak dapat diubah.

Kuota

Kuota berikut berlaku untuk Media CDN. Jika Anda memerlukan kuota yang lebih tinggi, hubungi tim penjualan Anda dan minta penyesuaian. Google Cloud Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.

Konfigurasi

Item Kuota default
Jumlah maksimum resource EdgeCacheService per project 20
Jumlah maksimum resource EdgeCacheOrigin per project 30
Jumlah maksimum resource EdgeCacheKeyset per project 10

Batas sistem

Batasan berikut berlaku untuk Media CDN.

Konfigurasi

Item Batas Catatan
Jumlah maksimum resource RouteRules per EdgeCacheService 200

Setiap EdgeCacheService dapat menentukan hingga 200 resource RouteRules.

Jumlah maksimum resource PathMatchers per EdgeCacheService 50

Setiap EdgeCacheService dapat menentukan hingga 50 resource PathMatchers.

Jumlah maksimum sertifikat SSL per layanan 5 Lihat kuota per project untuk sertifikat SSL.
Jumlah maksimum kunci publik per EdgeCacheKeyset 3 Beberapa kunci dalam keyset memungkinkan rotasi kunci. Menghapus kunci yang tidak digunakan dari waktu ke waktu.
Jumlah maksimum kunci bersama validasi per EdgeCacheKeyset 3 Beberapa kunci dalam set kunci dirancang untuk memungkinkan rotasi kunci: Anda harus menghapus kunci yang lebih lama dan tidak digunakan seiring waktu.

Header, permintaan, dan kode status HTTP

Item Batas Catatan
Ukuran header permintaan maksimum, termasuk jalur permintaan 16 KiB Batas ini tidak dapat ditingkatkan.

Bergantung pada protokol dasarnya, koneksi permintaan akan ditutup tanpa kode respons ditulis, atau permintaan ditolak dengan respons HTTP 431 Request Header Fields Too Long.

Permintaan ini dicatat dengan statusDetails headers_too_long, jika logging diaktifkan.

Ukuran isi permintaan maksimum 16 KiB Batas ini tidak dapat ditingkatkan.

Permintaan dengan isi yang melebihi batas ini akan ditolak dengan kode status HTTP 413 Content Too Large.

Ukuran header respons maksimum Sekitar 128 KiB

Respons origin dengan header yang melebihi batas ini akan menghasilkan kode status HTTP 502 Bad Gateway yang dikirim ke klien. Ini dicatat ke log dengan nilai statusDetails backend_response_headers_too_long, jika logging diaktifkan.

Ukuran objek yang dapat di-cache maksimum 100 GiB

Ini adalah ukuran maksimum objek di origin yang dapat di-cache oleh Media CDN. Objek yang lebih besar diperlakukan sebagai tidak dapat di-cache.

Ukuran respons maksimum yang tidak dapat di-cache 500 MiB

Ini adalah jumlah maksimum byte dalam isi respons yang di-proxy oleh Media CDN saat objek tidak dapat di-cache. Respons yang tidak dapat di-cache akan dipangkas setelah mencapai batas.

Konversi huruf kecil untuk header Selalu, untuk Media CDN Media CDN mengikuti konvensi HTTP/2 untuk huruf besar/kecil header permintaan dan respons.

Terlepas dari protokol yang digunakan, semua header dikonversi menjadi huruf kecil.

Misalnya, Host menjadi host, dan Keep-Alive menjadi keep-alive.

Huruf besar/kecil pada nilai header tidak diubah.

Batas rasio permintaan API

Jika memerlukan batas frekuensi panggilan yang lebih tinggi untuk permintaan API, Anda dapat meninjau penggunaan saat ini dan meminta peningkatan.

Item Batas
Pembatalan per EdgeCacheService 10 per menit
Semua panggilan yang tidak ada di namespace networkservices per project 1.200 panggilan per menit
Hanya baca: GetEdgeCache*, ListEdgeCache* per project 100 per menit
Baca/tulis: semua yang ada di namespace networkservices yang tidak ditandai sebagai hanya baca per project 100 per menit

Sebaiknya permintaan update, seperti create, patch, dan delete, dikirimkan satu per satu. Meskipun API mengantrekan beberapa permintaan serentak, pengiriman permintaan ini secara serentak dapat menyebabkan peningkatan latensi yang signifikan dan waktu pemrosesan yang lebih lama karena sistem memproses setiap item secara berurutan.

Waktu tunggu klien

Waktu habis Maximum duration Kode status Deskripsi
Maximum request duration 5 menit HTTP 408 Request Timeout Durasi maksimum satu permintaan-respons.
Header timeout 10 detik HTTP 408 Request Timeout Berapa lama klien harus mengirimkan kumpulan lengkap header permintaan.

Waktu tunggu server asal

  • connectTimeout dan maxAttemptsTimeout membatasi waktu yang dibutuhkan Media CDN untuk menemukan respons yang dapat digunakan.

    Kedua waktu tunggu mencakup waktu yang diperlukan asal untuk menampilkan header dan untuk menentukan apakah akan menggunakan failover atau pengalihan. connectTimeout berlaku secara independen untuk setiap upaya asal, sedangkan maxAttemptsTimeout mencakup waktu yang diperlukan untuk terhubung di semua upaya asal, termasuk failover dan pengalihan. Mengikuti pengalihan dihitung sebagai upaya tambahan untuk terhubung ke asal, dan dihitung dalam maxAttempts yang ditetapkan untuk asal yang dikonfigurasi.

    Saat Media CDN menemukan respons non-pengalihan, seperti dari origin pengalihan atau failover, nilai readTimeout dan responseTimeout akan diterapkan. Origin yang dialihkan menggunakan nilai connectTimeout, readTimeout, dan responseTimeout yang dikonfigurasi untuk EdgeCacheOrigin yang mengalami pengalihan.

  • responseTimeout dan readTimeout mengontrol durasi respons streaming dapat diperlukan. Setelah Media CDN menentukan bahwa Media CDN akan menggunakan respons upstream, connectTimeout maupun maxAttemptsTimeout tidak akan berpengaruh. Pada saat ini, readTimeout dan responseTimeout akan berlaku.

Media CDN melakukan maksimal empat upaya origin di semua origin, terlepas dari maxAttempts yang ditetapkan oleh setiap EdgeCacheOrigin. Media CDN menggunakan nilai maxAttemptsTimeout dari EdgeCacheOrigin utama. Nilai waktu tunggu per percobaan (connectTimeout, readTimeout, dan responseTimeout) dikonfigurasi untuk EdgeCacheOrigin setiap percobaan.

Tabel berikut menjelaskan kolom waktu tunggu:

Kolom Default Deskripsi
connectTimeout 5 detik

Jumlah waktu maksimum yang dapat digunakan Media CDN dari memulai permintaan ke origin hingga Media CDN menentukan apakah respons dapat digunakan. Secara praktis, connectTimeout mencakup waktu yang dimulai dengan membuat permintaan, lalu melakukan pencarian DNS, kemudian melakukan handshake TLS, pembentukan koneksi TCP/QUIC, hingga mendapatkan header respons yang berisi kode status HTTP.

Waktu tunggu harus berupa nilai antara 1 detik dan 15 detik.

maxAttemptsTimeout 15 detik

Waktu maksimum di semua upaya koneksi ke origin, termasuk origin failover, sebelum menampilkan error ke klien. Kode status HTTP 504 akan ditampilkan jika waktu tunggu habis sebelum respons ditampilkan.

Waktu tunggu harus berupa nilai antara 1 detik dan 30 detik.

Setelan ini menentukan durasi total untuk semua upaya koneksi asal, termasuk asal failover, untuk membatasi total waktu yang harus ditunggu klien agar konten mulai di-streaming. Hanya nilai maxAttemptsTimeout pertama yang digunakan, dengan pertama ditentukan oleh asal yang dikonfigurasi untuk rute tertentu.

readTimeout 15 detik

Durasi maksimum untuk menunggu di antara pembacaan satu respons HTTP. readTimeout dibatasi oleh responseTimeout. Semua pembacaan respons HTTP harus diselesaikan sebelum batas waktu yang ditetapkan oleh responseTimeout. Waktu tunggu harus berupa nilai antara 1 detik dan 30 detik. Jika waktu tunggu ini tercapai sebelum respons selesai, respons akan terpotong dan dicatat.

responseTimeout 30 seconds

Durasi maksimum yang diizinkan untuk menyelesaikan respons.

Waktu tunggu harus berupa nilai antara 1 detik dan 120 detik.

Durasi diukur dari saat byte isi pertama diterima. Jika waktu tunggu ini tercapai sebelum respons selesai, respons akan terpotong dan dicatat.

Mengelola kuota

Media CDN memberlakukan kuota pada penggunaan resource karena berbagai alasan. Misalnya, kuota melindungi komunitas pengguna Google Cloud dengan mencegah lonjakan penggunaan yang tidak terduga. Kuota juga membantu pengguna yang menjelajahi Google Cloud dengan paket gratis agar tetap berada dalam masa uji coba.

Semua project dimulai dengan kuota yang sama, yang dapat diubah dengan meminta kuota tambahan. Beberapa kuota dapat meningkat secara otomatis berdasarkan penggunaan produk oleh Anda.

Izin

Untuk melihat kuota atau meminta peningkatan kuota, akun utama Identity and Access Management (IAM) memerlukan salah satu peran berikut.

Tugas Peran yang diperlukan
Memeriksa kuota untuk suatu project Salah satu dari berikut ini:
Mengubah kuota, meminta kuota tambahan Salah satu dari berikut ini:
  • Project Owner (roles/owner)
  • Project Editor (roles/editor)
  • Quota Administrator (roles/servicemanagement.quotaAdmin)
  • Peran khusus dengan izin serviceusage.quotas.update

Memeriksa kuota

Konsol

  1. Di Google Cloud console, buka halaman Quotas.

    Buka Kuota

  2. Untuk menelusuri kuota yang ingin Anda perbarui, gunakan Filter table. Jika Anda tidak mengetahui nama kuota, gunakan link di halaman ini.

gcloud

Dengan menggunakan Google Cloud CLI, jalankan perintah berikut untuk memeriksa kuota Anda. Ganti PROJECT_ID dengan project ID Anda.

    gcloud compute project-info describe --project PROJECT_ID

Untuk memeriksa kuota yang digunakan di suatu region, jalankan perintah berikut:

    gcloud compute regions describe example-region
    

Error saat melebihi kuota

Jika Anda melampaui kuota dengan perintah gcloud, gcloud akan menghasilkan pesan error quota exceeded dan menampilkan kode keluar 1.

Jika Anda melampaui kuota dengan permintaan API, Google Cloud akan menampilkan kode status HTTP berikut: 413 Request Entity Too Large.

Meminta kuota tambahan

Untuk menyesuaikan sebagian besar kuota, gunakan konsol Google Cloud . Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.

Ketersediaan resource

Setiap kuota mewakili jumlah maksimum untuk jenis resource tertentu yang dapat Anda buat, jika resource tersebut tersedia. Perlu diperhatikan bahwa kuota tidak menjamin ketersediaan resource. Meskipun memiliki kuota yang tersedia, Anda tidak dapat membuat resource baru jika tidak tersedia.

Misalnya, Anda mungkin memiliki kuota yang memadai untuk membuat alamat IP eksternal regional baru di region tertentu. Namun, hal itu tidak mungkin dilakukan jika tidak ada alamat IP eksternal yang tersedia di region tersebut. Ketersediaan resource zona juga dapat memengaruhi kemampuan Anda untuk membuat resource baru.

Situasi ketika resource tidak tersedia di seluruh region jarang terjadi. Namun, resource dalam suatu zona dapat habis dari waktu ke waktu, biasanya tanpa memengaruhi perjanjian tingkat layanan (SLA) untuk jenis resource tersebut. Untuk informasi selengkapnya, tinjau SLA yang relevan untuk referensi tersebut.