Kontingente und Limits für Cloud Run

Auf dieser Seite werden die Kontingente und Limits für die Nutzung von Cloud Run erläutert.

Der Umfang der Cloud Run-Ressourcen ist begrenzt. Zu den Kontingenten für Cloud Run gehört auch eine API-Ratenbegrenzung, die bestimmt, mit welcher Rate die Cloud Run Admin API aufgerufen werden kann.

Für Folgendes besteht keine unmittelbare Begrenzung:

Die Größe der bereitstellbaren Container-Images.
Die Anzahl der gleichzeitigen Anfragen, die von einem Cloud Run-Dienst verarbeitet werden.

Ressourcenlimits für Cloud Run

Wenn Sie über die Limits hinausgehen möchten, die erhöht werden können, fordern Sie eine Kontingenterhöhung an. Wenn Sie die pro Projekt geltenden Limits überschreiten möchten, die nicht erhöht werden können, erstellen Sie neue Ressourcen in einem anderen Google Cloud -Projekt oder einer anderen Region.

Ressource	Umfang	Beschreibung	Limit	Kann erhöht werden
Dienst	pro Projekt und Region	Maximale Anzahl von Diensten	1.000	Nein
Job	pro Projekt und Region	Maximale Anzahl von Jobs	1000	Nein
Worker-Pool	pro Projekt und Region	Maximale Anzahl von Worker-Pools	1000	Nein
Jobausführung	pro Projekt und Region	Maximale Anzahl aktiver Jobausführungen	1000	Nein
Überarbeitung	pro Dienst	Maximale Anzahl von Überarbeitungen pro Dienst. Wenn das Limit erreicht wird, werden Revisionen, die keinen Traffic bedienen, in der Reihenfolge ihrer Erstellung automatisch gelöscht	1.000	Nein
Überarbeitung	pro Projekt und Region	Maximale Anzahl an Revisionen, die Traffic bedienen	4000	Nein
Revision-Tag	pro Projekt und Region	Maximale Anzahl von Revision-Tags. Wenn das Limit für Revision-Tags überschritten wird, führt Cloud Run eine Tag-Bereinigung für den Dienst durch. Für den Dienst, für den ein neues Tag erstellt wird, werden Tags ohne angegebenen Traffic-Prozentsatz automatisch in chronologischer Reihenfolge gelöscht.	2000	Nein
Jobausführung	pro Job	Aufbewahrungsdauer für abgeschlossene Jobausführungen. Wenn die Anzahl der abgeschlossenen Ausführungen für einen Job dieses Limit erreicht, werden Ausführungen automatisch in der Reihenfolge des Verlaufs gelöscht	1.000	Nein
Jobausführungsaufgabe¹	pro Jobausführung	Maximale Anzahl von parallel ausgeführten Aufgaben	Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. Sie können Ihr Kontingent auf der Konsolenseite Kontingente und Systemlimits einsehen.	Ja
Jobausführungsaufgabe	pro Jobausführung	Maximales Zeitlimit für Aufgaben	168 Stunden (7 Tage) oder 1 Stunde bei Verwendung von GPUs	Nein
Jobausführungsaufgabe	pro Jobausführung	Maximale Anzahl von Aufgaben in einem einzelnen Job	10.000	Nein
Jobausführungsaufgabe	pro Jobausführung	Maximale Anzahl von Aufgabenwiederholungen in einem Job	10	Nein
Umgebungsvariablen	pro Job oder pro Dienst	Maximale Anzahl von Umgebungsvariablen pro Container	1000	Nein
Befehlsargumente	pro Job oder pro Dienst	Maximale Anzahl von Befehlsargumenten pro Container	1000	Nein
Containerinstanz³	pro Überarbeitung und Region	Maximale Anzahl von Containerinstanzen mit ausgehendem Direct VPC-Traffic	100 bis 200, abhängig von den ausgewählten regionalen Konfigurationen.	Ja
Containerinstanz	pro Containerinstanz	Zeitüberschreitung beim Start in Minuten	4	Nein
Speicher	pro Containerinstanz	Maximale Arbeitsspeichergröße in GiB	32	Nein
CPU	pro Containerinstanz	Maximale Anzahl von vCPUs	8	Nein
CPU¹	pro Projekt und Region	Die maximale Gesamt-CPU in Milli-vCPUs, die über einen Zeitraum von einer Minute auf alle Instanzen verteilt wird.	Hängt von der ausgewählten Region ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein.	Ja
Arbeitsspeicher¹	pro Projekt und Region	Maximaler Gesamtspeicher in Byte, der über einen Zeitraum von einer Minute für alle Instanzen zugewiesen wurde.	Hängt von der ausgewählten Region ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. Sie können Ihr Kontingent auf der Konsolenseite Kontingente und Systemlimits einsehen.	Ja
GPU-Instanz ohne Garantie für zonenredundante Bereitstellung¹, ⁴	pro Projekt und Region	Maximale Anzahl von Containerinstanzen mit GPU	0⁴	Ja
GPU-Instanz mit Garantie für zonale Redundanz¹, ⁴	pro Projekt und Region	Maximale Anzahl von Containerinstanzen mit GPU	0⁴	Ja
Laufwerk	pro Containerinstanz	Maximal großes, beschreibbares In-Memory-Dateisystem, begrenzt durch den Instanzarbeitsspeicher in GiB	32	Nein
Umgebungsvariable	pro Variable	Maximale Variablenlänge in KB	32	Nein
Domainzuordnung	pro übergeordneter Domain und Woche	Maximale Anzahl von SSL-Zertifikaten	50	Nein
Domainzuordnung	pro übergeordneter Domain und Woche	Maximale Anzahl der Duplikate von SSL-Zertifikaten	5	Nein
Zugriffstoken	pro Containerinstanz und Sekunde	Maximale Anzahl der generierten eindeutigen Zugriffstokens	50	Nein
Identitätstoken	pro Containerinstanz und Sekunde	Maximale Anzahl der generierten eindeutigen Identitätstokens	50	Nein
Geöffnete Dateien	pro Containerinstanz	Maximale Anzahl von Dateien, die gleichzeitig geöffnet werden können. Entspricht `/proc/sys/fs/file-max`.	25.000	Nein

¹Diese regionalen Kontingente werden in einigen Fällen verwendet, in denen jeweils Folgendes gesteuert wird:

Der Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.

Die maximale Parallelität eines Jobs. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.

Die Gesamtzahl der Containerinstanzen für die Ausführung von Jobausführungen in einer Region.

³Dieses regionale Kontingent wird in einigen Fällen verwendet:

Es steuert den Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung mit Direct VPC-Ausgang ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.

Es steuert die maximale Parallelität eines Jobs mit ausgehendem Direct VPC-Traffic. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.

⁴ Bei neuen Projekten, in denen ein Dienst mit L4-GPUs erstellt wird, werden automatisch 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion gewährt. Sie können auch ein Kontingent für NvidiaL4GpuAllocPerProjectRegion oder NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion anfordern. Wenn Ihre maximale GPU-Nutzung nicht in der Nähe Ihres Kontingents liegt, kann Google Ihr Kontingent verringern.

Netzwerklimits für Cloud Run

Anfragelimits für Cloud Run

Beschreibung	Limit	Hinweise
Maximale Anzahl gleichzeitiger Anfragen pro Instanz	1000
Maximale Anzahl gleichzeitiger Streams pro HTTP/2-Clientverbindung	100
Maximale Zeit vor einer Zeitüberschreitung pro Anfrage	60 Minuten
Maximale Größe von HTTP/1-Anfragen	32 MiB bei Verwendung des HTTP/1-Servers. Keine Beschränkung bei Verwendung des HTTP/2-Servers.
Maximale Größe von HTTP/1-Antworten	32 MiB, wenn keine `Transfer-Encoding: chunked` oder Streaming-Mechanismen verwendet werden
Maximale Anzahl offener Verbindungen pro Instanz und Ausgabetyp (Internet oder VPC)	50.000	Gilt nicht für ausgehenden Direct VPC-Traffic.
Ausgehende Verbindungen pro Sekunde und Instanz	700	Gilt nicht für ausgehenden Direct VPC-Traffic, der an das VPC-Netzwerk gesendet wird. Dieser ist nicht begrenzt.
Ausgehende Verbindungen pro Minute und Instanz	5.000	Gilt nicht für ausgehenden Direct VPC-Traffic, der an das VPC-Netzwerk gesendet wird. Dieser ist nicht begrenzt.
Ausgehende DNS-Auflösungen pro Sekunde und Instanz	1000
Eingehende Anfragen pro Sekunde an einen HTTP/1-Containerport pro Instanz	800	Gilt nicht für HTTP/2-Containerports.

Bandbreitenlimits für Cloud Run

Für Cloud Run-Instanzen gelten folgende Bandbreitenlimits:

Beschreibung	Limit	Hinweise
Maximale Bit pro Instanz für ausgehenden Traffic über Direct VPC	1 Gbit/s	Ausgehender Traffic über Direct VPC zu Zielen im VPC-Netzwerk.
Maximale Bit pro Instanz, ohne ausgehenden Traffic über Direct VPC	600 Mbit/s	Basierend auf der Summe der eingehenden und ausgehenden Bit, ohne ausgehenden Traffic über den Direct VPC-Traffic zu Zielen im VPC-Netzwerk.
Maximale Gesamtpaketrate pro Instanz, ohne ausgehenden Traffic über Direct VPC	64.000 Pakete pro Sekunde	Basierend auf der Summe der eingehenden und ausgehenden Pakete, mit Ausnahme des ausgehenden Direct VPC-Traffics zu Zielen im VPC-Netzwerk.

Wird eines der beiden Limits erreicht, so gilt für die Cloud Run-Instanz eine eingeschränkte Bandbreite.

Ratenbegrenzung für Cloud Run Admin API

Die folgende Ratenbegrenzung gilt für die Cloud Run Admin API. Sie gelten nicht für die Anfragen, die bereitgestellte Cloud Run-Dienste erreichen.

Kontingent	Beschreibung	Limit	Kann erhöht werden	Umfang
Cloud Run Admin API-Leseanfragen	Die Anzahl der API-Lesevorgänge pro 60 Sekunden und Projekt. Dies ist nicht die Anzahl der Leseanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert.	3.000 pro 60 Sekunden	Ja	pro Projekt und Region
Cloud Run Admin API-Schreibanfragen	Die Anzahl der API-Schreibvorgänge pro 60 Sekunden und Region. Dies ist nicht die Anzahl der Schreibanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert.	180 pro 60 Sekunden	Ja	pro Projekt und Region
Jobausführung	Maximale Häufigkeit, mit der ein Job pro 60 Sekunden und Region ausgeführt werden kann.	180 pro 60 Sekunden	Ja	pro Projekt und Region

Kontingent erhöhen

Anfragen zur Anpassung von Cloud-Kontingenten unterliegen einer Prüfung. Wenn Ihre Anfrage zur Kontingentanpassung geprüft werden muss, erhalten Sie eine E‑Mail, in der der Eingang Ihrer Anfrage bestätigt wird. Falls Sie weitere Hilfe benötigen, antworten Sie einfach auf diese E‑Mail. Nach der Prüfung Ihrer Anfrage erhalten Sie eine E‑Mail-Benachrichtigung, in der Sie darüber informiert werden, ob Ihre Anfrage genehmigt wurde. Sie können eine Kontingentanpassung über die Google Cloud -Konsole, die Cloud Quotas API oder die Google Cloud CLI anfordern. In der folgenden Anleitung wird beschrieben, wie Sie einen neuen Kontingentwert über die Google Cloud -Konsole oder durch Senden einer REST-Anfrage an die Cloud Quotas API anfordern.

Console

So beantragen Sie eine Kontingentanpassung:

Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
Zur Seite „Kontingente und Systemlimits“
Wenn Sie aufgefordert werden, ein Projekt auszuwählen, wählen Sie das Projekt aus, das Sie anpassen möchten.
Suchen Sie das Kontingent, das Sie anpassen möchten, und öffnen Sie das Dialogfeld Kontingentänderungen:
- Nicht in der Tabelle enthaltene Kontingente:
  - Suchen Sie im Suchfeld Filter nach Ihrem Kontingent. Geben Sie die Region oder Zone (falls zutreffend) nicht an, da Kontingente ohne Nutzungs- oder angepasste Werte nicht in der Tabelle angezeigt werden.
  - Suchen Sie in der Tabelle nach Einträgen für Ihr Kontingent. Das kann der Standardeintrag oder ein beliebiger Eintrag mit Verlauf sein, unabhängig von Region oder Zone.
  - Klicken Sie in der Zeile des Eintrags auf Weitere Aktionen > Zusätzliche Regionen/Zonen konfigurieren.
  - Wählen Sie die Region oder Zone aus, die Sie anpassen möchten. Klicken Sie auf Bearbeiten.
- Alle anderen Kontingente:
  - Suchen Sie im Suchfeld Filter nach Ihrem Kontingent.
  - Klicken Sie in der Zeile für den Eintrag das Kästchen für Ihr Kontingent an.
  - Klicken Sie auf Bearbeiten.
Das Dialogfeld Kontingentänderungen wird angezeigt.
Wenn Sie über dem Feld Neuer Wert den Link Höheres Kontingent beantragen sehen und Ihr Kontingent über den auf dem Bildschirm angegebenen Wert hinaus erhöhen möchten, folgen Sie dem Link. Fülle das Formular aus, sende es ab und überspringe die restlichen Schritte. Andernfalls folgen Sie dieser Anleitung weiter.
Geben Sie im Feld Neuer Wert den gewünschten erhöhten Kontingentwert ein. Wenn das Feld Beschreibung der Anfrage angezeigt wird, geben Sie eine Beschreibung ein. Klicken Sie auf Fertig.
- Wenn Sie ein Kästchen mit dem Text „Ich bestätige, dass mit dieser Anfrage alle Überschreibungen entfernt werden“ sehen, ist Ihr Kontingentwert unter dem Standardwert festgelegt. Wenn Sie den Kontingentwert auf den Standardwert oder darüber hinaus anpassen, wird die Überschreibung entfernt. Setzen Sie ein Häkchen in das Kästchen, um fortzufahren. Weitere Informationen zu Kontingentüberschreibungen.
Wenn die Schaltfläche Weiter angezeigt wird, klicken Sie auf Weiter und geben Sie auf dem nächsten Bildschirm Ihre Kontaktdaten ein.
Klicken Sie auf Anfrage senden.

Wenn Sie feststellen, dass Sie eine Anpassung nicht über die Console beantragen können, fordern Sie die Erhöhung über Cloud Customer Care an.

Weitere Informationen zur Funktionsweise der Kontingenterhöhung finden Sie unter Kontingentanpassungen.

Batchanfragen für Kontingentanpassungen

Sie können Anfragen zur Kontingentanpassung zusammenfassen, indem Sie das Kästchen für jedes Kontingent ankreuzen, das Sie einbeziehen möchten. Durch das Bündeln von Anfragen kann sich die Zeit verlängern, die Google Cloud für die Überprüfung Ihrer Anfrage benötigt.

Um die Überprüfungszeit zu verkürzen, sollten Sie Anfragen zur Kontingentanpassung nach Produkt und Bereich gruppieren. Wenn Sie beispielsweise Anpassungen für Netzwerk- und Compute Engine-VM-Kontingente anfordern möchten, erstellen Sie eine Anfrage für die Netzwerkkontingente und eine weitere Anfrage für die Compute Engine-VM-Kontingente.

REST

Mit dem folgenden Codebeispiel können Sie eine Kontingentanpassung über die Cloud Quotas API anfordern. Geben Sie Ihre Werte in die bearbeitbaren Platzhalter ein. Informationen zu den Platzhalterfeldern finden Sie in den Beschreibungen nach dem Codebeispiel.

POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID {
    "service": "SERVICE_ID",
    "quotaId": "QUOTA_ID",
    "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" },
    "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" },
    "justification": "JUSTIFICATION",
    "contactEmail": "EMAIL"
}

Ersetzen Sie Folgendes:

PROJECT_NUMBER: Ihre Google Cloud Projektnummer. Sie finden Ihre Projektnummer auf der Willkommensseite der Google Cloud -Konsole oder durch Ausführen des folgenden gcloud CLI-Befehls:
```
PROJECT=$(gcloud info --format='value(config.project)')
gcloud projects describe ${PROJECT} --format="value(projectNumber)"
```
QUOTA_PREFERENCE_ID: Die ID der Kontingentpräferenz, die Sie aktualisieren.
QUOTA_ID: Die ID des Kontingents, das Sie aktualisieren.
SERVICE_ID: Die ID des Google Cloud , zu dem das anzupassende Kontingent gehört. Dieser hat in der Regel das Format SERVICE_NAME.googleapis.com. Der Compute Engine-Dienstname ist beispielsweise compute.googleapis.com.
DIMENSION_1: Der Typ der Dimension, die Sie anpassen möchten, z. B. region oder zone. Sie können mehrere Dimensionen einfügen. Trennen Sie die einzelnen Dimensionen durch ein Komma, z. B. VALUE_1. Wenn Sie alle Dimensionen des Kontingents anpassen möchten, lassen Sie diese Zeile weg.
VALUE_1: Der Wert der vorherigen Dimension. Wenn die vorhergehende Dimension beispielsweise region ist, geben Sie eine Region wie us-central1 ein.
JUSTIFICATION: Der Grund für diese Anfrage.
EMAIL: Eine E-Mail-Adresse, die als Kontakt verwendet werden kann, falls Google Cloud weitere Informationen benötigt, um eine Entscheidung zu treffen, bevor zusätzliches Kontingent gewährt werden kann.

Beispielanfrage

Das Folgende ist ein Beispiel für eine Anfrage zur Erhöhung des Kontingentwerts für das Compute Engine-Kontingent PUS-PER-GPU-FAMILY-per-project-region. Es wird ein Kontingentwert von 100 für Maschinen der GPU-Familie NVIDIA_H100 in der Region us-central1 angefordert.

POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
    "service": "compute.googleapis.com",
    "quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
    "quotaConfig": { "preferredValue": 100 },
    "dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
    "justification": "My justification.",
    "contactEmail": "222larabrown@gmail.com"
}

Kontingente und Limits für Cloud Run Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.