Kontingente und Systemlimits

In diesem Dokument sind die Kontingente und Systemlimits für Model Armor aufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.

Kontingent für API-Abfragen

Sie können dieses Kontingent in der Google Cloud Console erhöhen, ähnlich wie bei anderen Google Cloud Diensten.

Kontingent Wert
API-Abfragen 1.200 Abfragen pro Minute (Queries Per Minute, QPM) pro Projekt

Systemlimit für Eingabegröße

In der folgenden Tabelle wird das Systemlimit für die Größe der Eingabedatei oder des Eingabetexts angegeben.

Systemlimit Wert
Alle unterstützten Dateien und Text 4 MB

Token-Systemlimits

Model Armor hat je nach Filter unterschiedliche Systemlimits für Tokens.

Filter Systemlimit
Erkennung von Prompt Injection und Jailbreaking 10.000
Verantwortungsbewusste Anwendung von KI 10.000
Darstellungen des sexuellen Missbrauchs von Kindern 10.000
Schutz sensibler Daten 130.000

Wenn der Prompt oder die Antwort das Tokenlimit überschreitet, gibt der Schutz sensibler Daten-Filter EXECUTION_SKIPPED zurück. Alle anderen Filter geben MATCH_FOUND zurück, wenn im Prompt oder in der Antwort das Tokenlimit überschritten wird und in den ersten 10.000 Tokens schädliche Inhalte gefunden werden, oder EXECUTION_SKIPPED, wenn in den ersten 10.000 Tokens keine schädlichen Inhalte gefunden werden.

Messwertnamen für Kontingente und Systemlimits abrufen

Kontingente und Systemlimits haben zwei Arten von Namen: Anzeigenamen und Messwertnamen. Anzeigenamen enthalten Leerzeichen und Großbuchstaben, damit sie für Menschen leichter zu lesen sind. Messwertnamen werden eher in Kleinbuchstaben geschrieben und durch Unterstriche anstelle von Leerzeichen getrennt. Das genaue Format hängt vom Dienst ab.

In der folgenden Anleitung erfahren Sie, wie Sie Messwertnamen für Kontingente und Systemlimits über die Google Cloud -Konsole oder die gcloud CLI abrufen.

Console

  1. Rufen Sie in der Google Cloud Console die Seite IAM & Verwaltung > Kontingente & Systemlimits auf:

    Zur Seite „Kontingente und Systemlimits“

    In der Tabelle auf dieser Seite werden Kontingente und Systemlimits mit Nutzungs- oder angepassten Werten sowie ein Referenzeintrag für andere Kontingente angezeigt. Der Referenzeintrag ist in der Spalte Name am Ende des Eintrags in Klammern mit dem Wort „default“ gekennzeichnet. SetIAMPolicy requests per minute per region (default) ist beispielsweise der Referenzeintrag für das Kontingent SetIamPolicyRequestsPerMinutePerProject.

  2. Wenn die Spalte Messwert nicht angezeigt wird, gehen Sie so vor:

    1. Klicken Sie auf  Spaltenanzeigeoptionen.
    2. Wählen Sie Metric (Messwert) aus.
    3. Klicken Sie auf OK. Die Spalte Messwert wird in der Tabelle angezeigt.

In der Spalte Messwert werden die Messwertnamen angezeigt. Wenn Sie die Ergebnisse filtern möchten, geben Sie einen Namen oder Wert für das Attribut in das Feld neben Filter ein.

gcloud

Wenn Sie die Messwertnamen für einen Google Cloud Dienst mit der gcloud CLI abrufen möchten, führen Sie den Befehl quotas info list aus. Wenn Sie Zeilen überspringen möchten, in denen keine Messwertnamen aufgeführt sind, leiten Sie die Ausgabe an einen Befehl wie grep mit metric: als Suchbegriff weiter oder verwenden Sie das gcloud CLI-Flag --format:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

Ersetzen Sie Folgendes:

  • PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer.
  • SERVICE_NAME: Der Name des Dienstes, dessen Kontingentmesswerte Sie sehen möchten. Der Dienstname für Compute Engine ist beispielsweise compute.googleapis.com. Geben Sie den Teil googleapis.com des Dienstnamens an.

Kontingentanpassung anfordern

Die meisten Kontingente können Sie in der Google Cloud Console anpassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.