Kontingente und Systemlimits

In diesem Dokument sind die für die Agent Registry geltenden Kontingente und Systemlimits aufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Weitere Informationen finden Sie unter dem Cloud-Kontingente – Übersicht.

Zuteilungskontingente

Zuteilungskontingente beschränken die Menge einer bestimmten Ressource, die Sie mit der Agent Registry zu einem bestimmten Zeitpunkt verwenden können. Wenn Sie eine Ressource erstellen, wird Ihr verfügbares Kontingent für diese Ressource reduziert. Wenn Sie die Ressource löschen, wird das Kontingent wiederhergestellt.

In der folgenden Tabelle sind die Zuteilungskontingente für die Agent Registry und der Standardwert für jedes Kontingent aufgeführt.

Quota Wert
Regionale Dienste: Registrierte Agents, MCP-Server und Endpunkte pro Projekt und Region 100
Globale Dienste: Registrierte Agents, MCP-Server und Endpunkte pro Projekt 100

Ratenkontingente

Ratenkontingente beschränken die Rate, mit der Sie eine Ressource verbrauchen können. Minutenkontingente werden jede Minute zurückgesetzt. In der folgenden Tabelle sind die Ratenkontingente für die Agent Registry und der Standardwert für jedes Kontingent aufgeführt.

Quota Wert
Aggregierte API-Anfragen pro Minute und Projekt 12.000
API-Anfragen für regionale Standorte pro Minute 1.200
API-Anfragen für globale Standorte pro Minute 1.200

System limits

In der folgenden Tabelle sind die Systemlimits für die Agent Registry und der Wert für jedes Systemlimit aufgeführt.

System limit Wert
Länge des Anzeigenamens 63 Zeichen
Länge der Beschreibung 2.048 Zeichen
Größe des Inhalts der Agentenspezifikation 10 KB
Größe des Inhalts der MCP-Serverspezifikation 10 KB
Maximale Anzahl von Fähigkeiten oder Tools pro Dienst 100

Messwertnamen für Kontingente und Systemlimits abrufen

Kontingente und Systemlimits haben zwei Arten von Namen: Anzeigenamen und Messwertnamen. Anzeigenamen enthalten Leerzeichen und Großbuchstaben, damit sie für Menschen leichter zu lesen sind. Messwertnamen sind in der Regel kleingeschrieben und werden durch Unterstriche anstelle von Leerzeichen getrennt. Das genaue Format hängt vom Dienst ab.

In der folgenden Anleitung wird beschrieben, wie Sie Messwertnamen für Kontingente und System limits entweder über die Google Cloud Console oder die gcloud CLI abrufen.

Console

  1. Gehen Sie in der Google Cloud Console zu der IAM und Verwaltung > Kontingente und Systemlimits Seite:

    Zur Seite „Kontingente und Systemlimits“

    In der Tabelle auf dieser Seite werden Kontingente und Systemlimits mit Nutzung oder angepassten Werten sowie ein Referenzeintrag für andere Kontingente angezeigt. Der Referenzeintrag enthält in der Spalte Name am Ende der Auflistung in Klammern das Wort „standard“. Beispielsweise ist SetIAMPolicy requests per minute per region (default) der Referenzeintrag für das Kontingent SetIamPolicyRequestsPerMinutePerProject.

  2. Wenn die Spalte Messwert nicht angezeigt wird, führen Sie die folgenden Schritte aus.

    1. Klicken Sie auf Spaltenanzeigeoptionen.
    2. Wählen Sie Messwert aus.
    3. Klicken Sie auf OK. Die Spalte Messwert wird in der Tabelle angezeigt.

In der Spalte Messwert werden die Messwertnamen angezeigt. Wenn Sie die Ergebnisse filtern möchten, geben Sie einen Namen oder Wert für das Attribut in das Feld neben Filter ein.

gcloud

Führen Sie den quotas info list Befehl aus, um die Messwertnamen für einen Google Cloud Dienst mit der gcloud CLI abzurufen. Wenn Sie Zeilen überspringen möchten, in denen keine Messwertnamen aufgeführt sind, leiten Sie die Ausgabe an einen Befehl wie grep mit metric: als Suchbegriff weiter oder verwenden Sie das gcloud CLI --format-Flag:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

Ersetzen Sie Folgendes:

  • PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer.
  • SERVICE_NAME: der Name des Dienstes, dessen Kontingentmesswerte Sie sehen möchten. Der Dienstname für Compute Engine ist beispielsweise compute.googleapis.com. Fügen Sie den Teil googleapis.com des Dienstnamens ein.

Kontingentanpassung anfordern

Die meisten Kontingente können Sie in der Google Cloud Console anpassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.