Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Model Armor.
- Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian Google Cloud produk dan layanan
- Membatasi pemakaian resource tersebut
- Menyediakan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.
Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.
Kuota Model Armor API
Tabel berikut menentukan kuota untuk Model Armor API.
| Quota | Nilai |
|---|---|
| Kueri API | 1.200 kueri per menit (QPM) per project |
| Permintaan ke ExternalProcessor | 600 QPM per project 1 |
Anda dapat menerapkan nilai antara 0 hingga 1.200 QPM per project. Untuk meminta penyesuaian, lihat Meminta penyesuaian kuota. Jika Anda memerlukan kuota yang lebih besar dari kuota default, hubungi Cloud Customer Care.
Untuk mengetahui informasi tentang kuota terkait integrasi Model Armor dengan layanan lain, lihat Mengelola kuota.
1 Relevan jika Anda mengintegrasikan Model Armor dengan layanan Google Cloud lain.
Batas sistem ukuran input
Tabel berikut menentukan batas sistem pada ukuran file atau teks input. Model Armor akan melewati file atau teks yang melebihi batas ini.
| Batas sistem | Nilai |
|---|---|
| Semua file yang didukung dan teks | 4 MB |
Batas sistem token
Model Armor memiliki batas sistem yang bervariasi pada token bergantung pada filter tertentu.
| Filter | Batas sistem |
|---|---|
| Deteksi prompt injection dan jailbreak | 10.000 |
| Responsible AI | 10.000 |
| Materi pelecehan seksual terhadap anak-anak | 10.000 |
| Sensitive Data Protection | 130.000 |
Jika prompt atau respons melebihi batas token, filter Sensitive Data Protection akan menampilkan EXECUTION_SKIPPED. Semua filter lainnya, jika prompt atau respons melebihi batas token, akan menampilkan MATCH_FOUND jika konten berbahaya ditemukan dalam 10.000 token pertama atau EXECUTION_SKIPPED jika tidak ada konten berbahaya yang ditemukan dalam 10.000 token pertama.
Mendapatkan nama metrik kuota dan batas sistem
Kuota dan batas sistem memiliki dua jenis nama: nama tampilan dan nama metrik. Nama tampilan memiliki spasi dan kapitalisasi yang memudahkan manusia untuk membacanya. Nama metrik cenderung menggunakan huruf kecil dan dibatasi oleh garis bawah, bukan spasi; format pastinya bergantung pada layanan.
Petunjuk berikut menunjukkan cara mendapatkan nama metrik untuk kuota dan batas sistem menggunakan konsol atau gcloud CLI. Google Cloud
Konsol
Di Google Cloud konsol, buka halaman IAM & Admin> Quotas & System Limits:
Tabel di halaman ini menampilkan kuota dan batas sistem yang memiliki penggunaan atau telah menyesuaikan nilai, serta entri referensi untuk kuota lainnya. Entri referensi memiliki kata "default" dalam tanda kurung di akhir listingan di kolom Name. Misalnya,
SetIAMPolicy requests per minute per region (default)adalah entri referensi untuk kuotaSetIamPolicyRequestsPerMinutePerProject.Jika Anda tidak melihat kolom Metric, lakukan langkah-langkah berikut.
- Klik Column display options.
- Pilih Metric.
- Klik OK. Kolom Metric akan muncul di tabel.
Kolom Metric menampilkan nama metrik. Untuk memfilter hasil, masukkan a nama atau nilai properti di kolom di samping Filter.
gcloud
Untuk mendapatkan nama metrik untuk layanan menggunakan gcloud CLI, jalankan perintah quotas info list
command. Google Cloud Untuk melewati baris yang tidak mencantumkan nama metrik, teruskan output ke a
perintah seperti grep dengan metric: sebagai istilah penelusuran, atau gunakan
flag
--format gcloud CLI:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Ganti kode berikut:
PROJECT_ID_OR_NUMBER: ID project atau nomor project.SERVICE_NAME: nama layanan yang metrik kuotanya ingin Anda lihat—misalnya, nama layanan untuk Compute Engine adalahcompute.googleapis.com. Sertakan bagiangoogleapis.comdari nama layanan.