In diesem Dokument sind die Kontingente und Systemlimits für Media CDN aufgeführt.
- Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Google Cloud Produkten und Diensten.
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.
Für Media CDN-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Kontingente
Für Media CDN gelten die folgenden Kontingente. Wenn Sie ein höheres Kontingent benötigen, wenden Sie sich an Ihr Google Cloud -Vertriebsteam und beantragen Sie Anpassungen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.
Konfiguration
| Element | Standardkontingent |
|---|---|
Maximale Anzahl von EdgeCacheService-Ressourcen pro Projekt |
20 |
Maximale Anzahl von EdgeCacheOrigin-Ressourcen pro Projekt |
30 |
Maximale Anzahl von EdgeCacheKeyset-Ressourcen pro Projekt |
10 |
Systemlimits
Für Media CDN gelten die folgenden Limits.
Konfiguration
| Element | Limits | Hinweise |
|---|---|---|
Maximale Anzahl von RouteRules-Ressourcen pro EdgeCacheService |
200 | In jedem |
Maximale Anzahl von PathMatchers-Ressourcen pro EdgeCacheService |
50 | In jedem |
| Maximale Anzahl von SSL-Zertifikaten pro Dienst | 5 | Informationen zum Kontingent pro Projekt für SSL-Zertifikate. |
Maximale Anzahl öffentlicher Schlüssel pro EdgeCacheKeyset |
3 | Mehrere Schlüssel in einem Schlüsselsatz ermöglichen die Schlüsselrotation. Entfernen Sie im Laufe der Zeit nicht verwendete Schlüssel. |
Maximale Anzahl für Validierungen freigegebener Schlüssel pro EdgeCacheKeyset |
3 | Mehrere Schlüssel in einem Schlüsselsatz wurden für die Schlüsselrotation entwickelt: Sie sollten ältere und nicht verwendete Schlüssel im Laufe der Zeit entfernen. |
HTTP-Header, -Anfragen und -Statuscodes
| Element | Limits | Hinweise |
|---|---|---|
| Maximale Anfrageheader-Größe, einschließlich Anfragepfad | 16 KiB | Dieses Limit kann nicht erhöht werden.
Je nach zugrunde liegendem Protokoll wird die Anfrageverbindung entweder geschlossen, ohne dass ein Antwortcode geschrieben wird, oder die Anfrage wird mit einer HTTP-
Diese Anfragen werden mit einem |
| Maximale Größe des Anfragetexts | 16 KiB | Dieses Limit kann nicht erhöht werden.
Anfragen mit einem Textkörper, der dieses Limit überschreitet, werden mit dem HTTP-Statuscode |
| Maximale Größe von Antwortheadern | Ca. 128 KiB |
Ursprungsantworten mit Headern, die dieses Limit überschreiten, führen dazu, dass ein HTTP-Statuscode |
| Maximale Größe cachefähiger Objekte | 100 GiB |
Dies ist die maximale Größe von Objekten am Ursprung, die Media CDN im Cache speichern kann. Größere Objekte werden als nicht cachefähig behandelt. |
| Maximale Größe nicht cachefähiger Antworten | 500 MiB |
Dies ist die maximale Anzahl von Bytes in einem Antworttext, die Media CDN weiterleitet, wenn ein Objekt nicht im Cache gespeichert werden kann. Nicht cachefähige Antworten werden gekürzt, sobald das Limit erreicht ist. |
| Umwandlung der Header in Kleinbuchstaben | Immer für Media CDN | Media CDN folgt den HTTP/2-Konventionen für Groß- und Kleinschreibung von Anfrage- und Antwortheadern.
Alle Header werden ungeachtet des verwendeten Protokolls in Kleinbuchstaben umgewandelt. Beispiel: Die Groß- und Kleinschreibung von Headerwerten wird nicht geändert. |
Limits für API-Anfrageraten
Wenn Sie eine höhere Ratenbegrenzung für API-Anfragen benötigen, können Sie die aktuelle Verwendung prüfen und eine Erhöhung anfordern.
| Element | Limits |
|---|---|
Außerkraftsetzungen pro EdgeCacheService |
10 pro Minute |
Alle Aufrufe, die nicht im networkservices-Namespace pro Projekt enthalten sind |
1.200 Anrufe pro Minute |
Schreibgeschützt: GetEdgeCache*,
ListEdgeCache* pro Projekt |
100 pro Minute |
Lesen/Schreiben: alles im Namespace networkservices, das nicht als schreibgeschützt markiert ist (pro Projekt) |
100 pro Minute |
Wir empfehlen, Aktualisierungsanfragen wie create, patch und delete einzeln zu senden. Die API stellt zwar mehrere gleichzeitige Anfragen in die Warteschlange, aber das gleichzeitige Senden dieser Anfragen kann zu einer erheblich erhöhten Latenz und längeren Verarbeitungszeiten führen, da das System jedes Element seriell verarbeitet.
Client-Timeouts
| Zeitlimit | Maximale Dauer | Statuscode | Beschreibung |
|---|---|---|---|
| Maximum request duration | 5 Minuten | HTTP 408 Request Timeout |
Die maximale Dauer für die Antwort auf eine einzelne Anfrage. |
| Header timeout | 10 Sekunden | HTTP 408 Request Timeout |
Wie lange der Client benötigen darf, um den vollständigen Satz von Anfrageheadern zu senden. |
Ursprungszeitlimits
connectTimeoutundmaxAttemptsTimeoutbegrenzen, wie lange Media CDN benötigt, um eine verwendbare Antwort zu finden.Beide Zeitüberschreitungen umfassen die Zeit, die der Ursprung benötigt, um Header zurückzugeben und festzulegen, ob ein Failover oder eine Weiterleitung verwendet werden soll.
connectTimeoutgilt unabhängig für jeden Ursprungsversuch, währendmaxAttemptsTimeoutdie Zeit einschließt, die für die Verbindung bei allen Ursprungsversuchen erforderlich ist, einschließlich Failovers und Weiterleitungen. Das Folgen einer Weiterleitung zählt als zusätzlicher Versuch, eine Verbindung zum Ursprung herzustellen, und wird auf die für den konfigurierten Ursprung festgelegtenmaxAttemptsangerechnet.Wenn Media CDN auf eine Antwort ohne Weiterleitung trifft, z. B. von einem Weiterleitungs- oder Failover-Ursprung, gelten die Werte
readTimeoutundresponseTimeout. Weitergeleitete Ursprünge verwenden die WerteconnectTimeout,readTimeoutundresponseTimeout, die für denEdgeCacheOriginkonfiguriert sind, der auf die Weiterleitung gestoßen ist.Mit
responseTimeoutundreadTimeoutwird gesteuert, wie lange eine gestreamte Antwort dauern kann. Nachdem Media CDN festgestellt hat, dass eine Upstream-Antwort verwendet wird, sind wederconnectTimeoutnochmaxAttemptsTimeoutrelevant. An diesem Punkt tretenreadTimeoutundresponseTimeoutin Kraft.
Media CDN führt maximal vier Ursprungsversuche über alle Ursprünge hinweg aus, unabhängig von den von jedem EdgeCacheOrigin festgelegten maxAttempts.
Media CDN verwendet den maxAttemptsTimeout-Wert aus dem primären EdgeCacheOrigin. Die Zeitlimitwerte pro Versuch (connectTimeout, readTimeout und responseTimeout) werden für den EdgeCacheOrigin jedes Versuchs konfiguriert.
In der folgenden Tabelle werden die Zeitlimitfelder beschrieben:
| Feld | Standard | Beschreibung |
|---|---|---|
| connectTimeout | 5 Sekunden | Der maximale Zeitraum, den Media CDN ab dem Starten der Anfrage an den Ursprung benötigen darf, bis Media CDN bestimmt, ob die Antwort verwendbar ist. In der Praxis deckt Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 15 Sekunden sein. |
| maxAttemptsTimeout | 15 Sekunden | Die maximale Zeit für alle Verbindungsversuche zum Ursprung, einschließlich Failover-Ursprünge, bevor ein Fehler an den Client zurückgegeben wird.
Wenn das Zeitlimit erreicht ist, bevor eine Antwort zurückgegeben wird, wird ein HTTP-Statuscode Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 30 Sekunden sein. Diese Einstellung definiert die Gesamtdauer für alle Ursprungsverbindungsversuche, einschließlich Failover-Ursprünge, um die Gesamtzeit zu begrenzen, die Clients warten müssen, bis das Streamen von Inhalten startet. Es wird nur der erste |
| readTimeout | 15 Sekunden | Die maximale Wartezeit zwischen Lesevorgängen einer einzelnen HTTP-Antwort.
Das |
| responseTimeout | 30 Sekunden | Die maximale Dauer, bis eine Antwort abgeschlossen sein muss. Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 120 Sekunden sein. Die Dauer wird ab dem Zeitpunkt gemessen, an dem die ersten Body-Bytes empfangen werden. Wenn dieses Zeitlimit erreicht wird, bevor die Antwort vollständig ist, wird die Antwort abgeschnitten und protokolliert. |
Kontingente verwalten
MitMedia CDN werden Kontingente für die Ressourcennutzung aus verschiedenen Gründen festgelegt. Kontingente schützen unter anderem die gesamte Google Cloud -Community vor unerwarteten Nutzungsspitzen. Außerdem unterstützen Kontingente Nutzer, die Google Cloud mit der kostenlosen Stufe prüfen, dabei, im Rahmen der Testversion zu verbleiben.
Alle Projekte beginnen mit den gleichen Kontingenten, die Sie ändern können, indem Sie zusätzliche Kontingente anfordern. Einige Kontingente könnten entsprechend Ihrer Nutzung eines Produkts automatisch erhöht werden.
Berechtigungen
Zur Anzeige von Kontingenten oder zur Anforderung von Kontingenterhöhungen benötigen IAM-Hauptkonten (Identity and Access Management) eine der folgenden Rollen:
| Aufgabe | Erforderliche Rolle |
|---|---|
| Kontingente für ein Projekt prüfen | Beispiele:
|
| Kontingente ändern, zusätzliche Kontingente anfordern | Beispiele:
|
Kontingent prüfen
Console
- Rufen Sie in der Google Cloud Console die Seite Kontingente auf.
- Mit dem Feld Tabelle filtern können Sie nach den zu aktualisierenden Kontingenten suchen. Wenn Sie den Namen des Kontingents nicht kennen, verwenden Sie stattdessen die Links auf dieser Seite.
gcloud
Führen Sie mit der Google Cloud CLI den folgenden Befehl aus, um Ihre Kontingente zu prüfen. Ersetzen Sie PROJECT_ID durch Ihre Projekt-ID:
gcloud compute project-info describe --project PROJECT_IDMit dem folgenden Befehl prüfen Sie das genutzte Kontingent in einer Region:
gcloud compute regions describe example-region
Fehler beim Überschreiten Ihres Kontingents
Wenn Sie ein Kontingent mit einem gcloud-Befehl überschreiten, gibt gcloud eine quota exceeded-Fehlermeldung aus und liefert den Exit-Code 1.
Wenn Sie mit einer API-Anfrage ein Kontingent überschreiten,gibt Google Cloud den folgenden HTTP-Statuscode zurück: 413 Request Entity Too Large. Google Cloud
Weitere Kontingente anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung beantragen.
Ressourcenverfügbarkeit
Jedes Kontingent stellt die maximale Anzahl an Ressourcen eines bestimmten Typs dar, die Sie erstellen können, sofern der Ressourcentyp verfügbar ist. Beachten Sie, dass Kontingente die Verfügbarkeit von Ressourcen nicht garantieren. Selbst wenn Sie ein verfügbares Kontingent haben, können Sie keine neue Ressource erstellen, wenn keine verfügbar ist.
Beispiel: Sie haben noch ein ausreichendes Kontingent zum Erstellen einer neuen regionalen externen IP-Adresse in einer bestimmten Region. Dies ist jedoch nicht möglich, wenn in dieser Region keine externen IP-Adressen verfügbar sind. Die Verfügbarkeit von zonalen Ressourcen kann sich auch auf Ihre Fähigkeit auswirken, eine neue Ressource zu erstellen.
Es kommt nur selten vor, dass Ressourcen in einer kompletten Region nicht verfügbar sind. Ressourcen innerhalb einer Zone können aber manchmal vorübergehend ausgeschöpft sein, ohne dass sich das auf das Service Level Agreement (SLA) für den Ressourcentyp auswirkt. Weitere Informationen finden Sie im entsprechenden SLA für die Ressource.