In diesem Dokument sind die für die Agent Registry geltenden Kontingente und Systemlimits aufgeführt.
- Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Google Cloud Produkten und Diensten.
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Weitere Informationen finden Sie unter dem Cloud-Kontingente – Übersicht.
Zuteilungskontingente
Zuteilungskontingente beschränken die Menge einer bestimmten Ressource, die Sie mit der Agent Registry zu einem bestimmten Zeitpunkt verwenden können. Wenn Sie eine Ressource erstellen, wird Ihr verfügbares Kontingent für diese Ressource reduziert. Wenn Sie die Ressource löschen, wird das Kontingent wiederhergestellt.
In der folgenden Tabelle sind die Zuteilungskontingente für die Agent Registry und der Standardwert für jedes Kontingent aufgeführt.
| Quota | Wert |
|---|---|
| Regionale Dienste: Registrierte Agents, MCP-Server und Endpunkte pro Projekt und Region | 100 |
| Globale Dienste: Registrierte Agents, MCP-Server und Endpunkte pro Projekt | 100 |
Ratenkontingente
Ratenkontingente beschränken die Rate, mit der Sie eine Ressource verbrauchen können. Minutenkontingente werden jede Minute zurückgesetzt. In der folgenden Tabelle sind die Ratenkontingente für die Agent Registry und der Standardwert für jedes Kontingent aufgeführt.
| Quota | Wert |
|---|---|
| Aggregierte API-Anfragen pro Minute und Projekt | 12.000 |
| API-Anfragen für regionale Standorte pro Minute | 1.200 |
| API-Anfragen für globale Standorte pro Minute | 1.200 |
System limits
In der folgenden Tabelle sind die Systemlimits für die Agent Registry und der Wert für jedes Systemlimit aufgeführt.
| System limit | Wert |
|---|---|
| Länge des Anzeigenamens | 63 Zeichen |
| Länge der Beschreibung | 2.048 Zeichen |
| Größe des Inhalts der Agentenspezifikation | 10 KB |
| Größe des Inhalts der MCP-Serverspezifikation | 10 KB |
| Maximale Anzahl von Fähigkeiten oder Tools pro Dienst | 100 |
Messwertnamen für Kontingente und Systemlimits abrufen
Kontingente und Systemlimits haben zwei Arten von Namen: Anzeigenamen und Messwertnamen. Anzeigenamen enthalten Leerzeichen und Großbuchstaben, damit sie für Menschen leichter zu lesen sind. Messwertnamen sind in der Regel kleingeschrieben und werden durch Unterstriche anstelle von Leerzeichen getrennt. Das genaue Format hängt vom Dienst ab.
In der folgenden Anleitung wird beschrieben, wie Sie Messwertnamen für Kontingente und System limits entweder über die Google Cloud Console oder die gcloud CLI abrufen.
Console
Gehen Sie in der Google Cloud Console zu der IAM und Verwaltung > Kontingente und Systemlimits Seite:
Zur Seite „Kontingente und Systemlimits“
In der Tabelle auf dieser Seite werden Kontingente und Systemlimits mit Nutzung oder angepassten Werten sowie ein Referenzeintrag für andere Kontingente angezeigt. Der Referenzeintrag enthält in der Spalte Name am Ende der Auflistung in Klammern das Wort „standard“. Beispielsweise ist
SetIAMPolicy requests per minute per region (default)der Referenzeintrag für das KontingentSetIamPolicyRequestsPerMinutePerProject.Wenn die Spalte Messwert nicht angezeigt wird, führen Sie die folgenden Schritte aus.
- Klicken Sie auf Spaltenanzeigeoptionen.
- Wählen Sie Messwert aus.
- Klicken Sie auf OK. Die Spalte Messwert wird in der Tabelle angezeigt.
In der Spalte Messwert werden die Messwertnamen angezeigt. Wenn Sie die Ergebnisse filtern möchten, geben Sie einen Namen oder Wert für das Attribut in das Feld neben Filter ein.
gcloud
Führen Sie den quotas info list
Befehl aus, um die Messwertnamen für einen Google Cloud Dienst mit
der gcloud CLI abzurufen. Wenn Sie Zeilen überspringen möchten, in denen keine Messwertnamen aufgeführt sind, leiten Sie die Ausgabe an einen
Befehl wie grep mit metric: als Suchbegriff weiter oder verwenden Sie das
gcloud CLI
--format-Flag:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Ersetzen Sie Folgendes:
PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer.SERVICE_NAME: der Name des Dienstes, dessen Kontingentmesswerte Sie sehen möchten. Der Dienstname für Compute Engine ist beispielsweisecompute.googleapis.com. Fügen Sie den Teilgoogleapis.comdes Dienstnamens ein.
Kontingentanpassung anfordern
Die meisten Kontingente können Sie in der Google Cloud Console anpassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.